概述

基本介绍

TableOne基于给定的数据集和分组条件,自动生成描述性统计表用于比较和汇总不同组间的基本统计信息的工具,底层使用scipy和statsmodels统计模块实现。

综合评价

TableOne 主要特点:
- 1.单因素统计分析工具
- 2.简化分析流程
- 3.常用于生成论文中的表格 TableOne
局限性:
- 1. 只能用于分类任务的统计假设,目标值为分类型变量;回归任务可以统计描述,统计假设还需要借助其他方法
- 2. 不支持多因素分析
pip install tableone

核心代码:tableone.py,github链接

相关文献,如果论文中借助tableone工具进行统计分析,需将该文献添加到参考文献中

Tom J Pollard, Alistair E W Johnson, Jesse D Raffa, Roger G Mark; tableone: An open source Python package for producing summary statistics for research papers, JAMIA Open, Volume 1, Issue 1, 1 July 2018, Pages 26–31 论文地址

输出概览:

在表格下方会输出提示行并显示以下信息 (有一些版本不支持显示)

- 非正态指标

- 异常值指标

- 多模态分布

论文中使用常见问题

论文支持中,如果正文没有涉及数据分布,一般都会在小修阶段建议以附表形式补充。

htest_namepval

tableone具体使用

基本功能

tableone==0.7.9

代码示例

通常mytable得到的不是DataFrame格式,如果需要将结果进行一些变换,可以通过以下方法转成DataFrame再操作。

table.cont_table用于连续变量-->读取DataFrame格式
table.cat_table 用于离散变量-->读取DataFrame格式
table.tableone 用于整体输出-->读取DataFrame格式

注册统计 (目前使用不多)

  • htest变量 (针对某个特征的检验方法)

TableOne接口的详细信息

具有多种参数和功能,包括显示P值、自定义假设检验、替换标签为中文、排序变量、添加备注等。