分类数据在医学统计中很常见,一些统计书籍将其称为计数数据,例如(有效、无效)、(病态、非病态)、(男性、女性)、血型(A、B、O、AB)等。分类数据一般按照频率组织成列联表的形式,一般的列联表多为二维的(也叫行表,或称 R×C 列联表,高维列联表将在下次讨论),列联表可分为双向无序、 单项排序,根据变量是否排序,以及统计方法不同,进行双向顺序列联表,分析如下:
1. 双向无序连接表
(1) 一组四格表格
例如,为了研究吸烟与肺癌之间的关系,行变量是 smoking: smoking, non-smoking,列变量是 lung cancer incidence: onset, non-incidence,如下表所示
对于这类数据,我们的统计目的是分析列变量的独立性,即肺癌的发病率是否与吸烟有关,有两种方法可以采用:
1. Pearson 卡方检验:
基于卡方分布,H0 独立于行和列变量,这可以在 SPSS 中实现,例如“分析->描述性统计->交叉表”。四格表使用条件:特殊公式 (1) 样本总数大于 40;(2) 每个单元格的理论值大于 5。校正公式:(1) 样本总数大于 40;(2) 理论值 1
2. 费舍尔精确概率:
基于超几何分布,当数据不满足 Pearson 卡方检验时,将使用该指标。在 SPSS 中血型不能配对表图,可以实现 “Analysis->Descriptive Statistics->Cross Table”。请注意,SPSS 仅提供 2×2 表的精确概率,您需要计算 R×C 列联表的精确概率,并且可以在精确按钮中选择蒙特卡洛近似方法。
(2) R×C 组表(双向无序)。
1. Pearson 卡方检验
条件:任何网格都不能有理论频率 T
如果不是:可以增加研究样本量(通常谨慎使用);合并或删除理论频率较小的行或列;使用 R×C 表的 Fisher 精确概率法(通常为蒙特卡洛近似)
2. R×C 表 Fisher 精确概率法
操作:分析 - 描述 - 交叉表 - 设置行和列变量 - 单击精确 - 选择 Monte Carlo。
其次,有一个用于各个项目的序列列表
结果变量是有序的,而原因变量是无序的,这是很常见的。例如,比较两种药物在 AB 中的治疗效果,药物分组 (AB) 是无序的,而结果变量是有序的 (无效、明显、治愈),可以安排到下表中:
可以选择的主要统计方法有:
1. Mann-Whitney U 检验
基于卡方分布,H0 与两组的整体分布一致,这可以在 SPSS 中的“分析>非参数检验>独立样本”中实现。
注: 在 SPSS 中,如果将数据整理到列联表中分享交流 :选取 R×C 列联表的统计分析方法,并采用 SPSS 实现,则需要按频率对数据进行加权。变量编码为:(1) 药物(标称):A = 1,B = 2,(2) 疗效(测量):无效 = 1,有效 = 2,治愈 = 3,(3) 频率(测量)。
2. Kruskal-Wallis H 检验:
当组数大于 2 时使用,例如比较 3 种或更多药物的疗效。实现类似于 Mann-WhitneyU。
注意:当行变量有序时,通常将其视为无序变量。但是,如果行变量是有序变量,而列变量是二进制比率,则还可以根据研究的目的选择趋势卡方检验。
3. 两个方向都有一个顺序表
1. 行和列的变量有序但属性不同
例如血型不能配对表图,在这个例子中,为了比较某种药物对某种疾病的治疗效果,按年龄组分组,以检查治疗效果是否与年龄组相关血型不能配对表图,组织到下表中:
行和列是有序的,这是我们主要关心的:列和列之间是否存在相关性,如果有,是线性关系还是曲线关系。您可以选择的方法如下:
(1) Spearman 等级相关:
相关性检验基于卡方检验,可以在 SPSS“分析->相关性->双样本”中实现。
(2) 线性趋势的卡方检验:
该测试具有无线关系,基于卡方检验,SPSS“Analysis-> Cross Table”的卡方结果表中的“线性和线性组合”就是这样。
2. 行和列已排序,并且属性相同
(1) 行列式变量和列变量是独立的
通常是为了检查一致性。例如,如果使用两台仪器测试同一个样品,结果分为阴性和阳性,那么现在需要比较两台仪器的结果是否一致。组织到下表中:
常用的方法是:
Kappa 一致性检查:
H0 是没有一致性的行列式变量。这可以在 SPSS “Analysis->Descriptive Statistics-> Crosstabs” 中完成。
(2) 配对行列表
行列变量是配对数据,例如,如果有某种药物可以缓解某种疾病的某种症状,比较同一患者用药前后的症状,评价该药物的数据效果,如下表所示:
可用的统计方法:
(1) McNemar 检验:
仅用于 2×2 列联表。基于卡方分布。这可以在 SPSS “Analysis->Descriptive Statistics-> Crosstabs” 中完成。本测试与 Pearson 卡方检验相同分享交流 :选取 R×C 列联表的统计分析方法,并采用 SPSS 实现,使用条件必须满足 Pearson 卡方检验的条件。如果不满足条件,则需要进行 Yate 校正。
(2) Bowker 测试:
是 McNemar 检验的扩展,用于配对列联表分析分享交流 :选取 R×C 列联表的统计分析方法,并采用 SPSS 实现,具有大于 2 的类数。这可以在 SPSS “Analysis->Descriptive Statistics-> Crosstabs” 中完成。在 SPSS 中仍选择了 Mcnemar,输出是 Mcnemar-Bowker 结果。
什么是行变量和列变量?设置原则一般如下:实验设计三要素中的干预因子为行变量,实验效果指标为列变量。
版权说明:以上内容来自网友投稿,若有侵权请联系
★文章来自爱算卦网,未经允许不得转载!★