admin 发表于 2021-9-14 15:03:26

干货 | 秩和检验及其两两比较的思路与解析

在之前的文章中,我们介绍了两组和多组正态分布数据的组间比较方法。在本文中,我们将要讲解的则是用于检验非正态分布数据差异的统计方法——秩和检验。本文将重点介绍以下内容:非独立样本秩和检验、单样本秩和检验和配对样本秩和检验。
为了帮助更多的临床医师学习如何运用JMP高效地开展数据分析,提高日常工作和发表论文的效率,2020年8月起,JMP资深用户、JMP特约专栏作者、资深统计学家冯国双博士及其团队将在JMP数据分析平台为大家分享一系列统计及数据分析、JMP实战操作、JMP分析报表解读等干货内容,每期一个经典话题,帮助大家掌握一个新技能。值得注意的是,这些话题并非仅针对临床医师,对所有运用JMP软件开展数据分析的小伙伴都适用。本文为此系列文章的第14期。
秩和检验属于非参数检验,非参数检验不考虑总体的参数和总体的分布类型,而是对样本所代表的总体的分布和分布位置进行假设检验。秩和检验的基本思想是:首先进行编秩,然后用秩次代替原始数据信息来进行检验。基于秩次检验各组的平均秩是否相等,如果经检验得各组的平均秩不相等,则可以推论数据的分布不同。

本文主要用到两个数据进行讲解,一个是BMI的数据(图1),另一个是IgA的数据(图2)。
图1 BMI数据

图2 IgA数据

01 独立样本秩和检验

独立样本的秩和检验主要有两种方法:用于两组比较的Wilcoxon秩和检验和用于多组比较的Kruskal-Wallis秩和检验,详见前文(一个神奇的JMP菜单,实现数据的所有组间比较)。二者的关系有点类似于t检验和方差分析的关系。
两组比较可以用Wilcoxon秩和检验,也可以用Kruskal-Wallis秩和检验;多组比较只能用Kruskal-Wallis秩和检验。
两组和多组独立样本秩和检验的操作一致,为了避免重复介绍,本文仅以多组样本的秩和检验为例进行介绍。
图1数据中,拟比较不同心功能分级患者的BMI是否存在差异。心功能分级分为四级,分别用1-4表示,BMI为非正态分布,因此考虑Kruskal-Wallis秩和检验。

首先通过点选JMP“分析”→“以X拟合Y”(图3),进入组间差异比较的界面。

图3 独立样本秩和检验操作——菜单选择

本例中BMI为结果,心功能分级为分组,因此在对话框中将BMI放入“Y,响应”,将“心功能分级”放入“X,因子”(图4)。

图4 独立样本秩和检验操作——变量选择
进入结果界面后,点击“心功能分级-BMI”单因子分析旁边的红色三角形按钮,在下拉菜单中选择“非参数→Wilcoxon检验”(图5)。

图5 独立样本秩和检验操作——方法选择

输出结果见图6. 结果主要有两部分:第一部分是数据描述,给出每组的例数、秩和、平均秩等信息。从得分均值的结果可知,心功能分级为4的患者BMI最高。第二部分为统计检验结果,给出了Kruskal-Wallis秩和检验的结果。表明不同心功能分级患者的BMI差异有统计学意义(卡方=10.4306,P=0.0152)。
注意:这里给出的统计量是卡方,是因为Kruskal-Wallis秩和检验的结果服从卡方分布,并不是说做了卡方检验,大家不要搞混了。


图6独立样本秩和检验操作——检验结果
请注意,如果进行两组样本的秩和检验,会同时给出Wilcoxon秩和检验和Kruskal-Wallis秩和检验两个结果,两种检验的结果一致。
Kruskal-Wallis秩和检验结果显示有统计学差异,通常我们还对具体哪两组有差异感兴趣,这就需要进行组间两两比较。
点击“心功能分级-BMI”单因子分析旁边的红色三角形按钮,在下拉菜单中选择“非参数”→“非参数多重比较”→“对所有对执行Steel-Dwass检验”,操作见图7。

图7 独立样本秩和检验操作——两两比较操作
输出结果见图8,两两比较结果表明,心功能分级中的水平2和4(Z=3.089,P=0.0108);水平3和4(Z=3.057,P=0.0120)的差异有统计学意义。

图8 独立样本秩和检验操作——两两比较检验结果

本例分析结果表明,不同心功能分级患者的BMI的差异有统计学意义。两两比较结果显示,心功能分级水平2和4;3和4的差异有统计学意义。

02单样本秩和检验

基于图1数据,探索患者的BMI与健康人群的正常值是否存在差异。假定BMI的正常值为19,BMI为非正态分布,则进行单样本秩和检验。
在既往的文章中我们已经为大家讲解了正态分布数据如何进行单样本t检验(点这里可回顾),若数据为非正态分布,应如何操作呢?
单样本秩和检验操作的前四步与单样本t检验相同:
①选择JMP菜单“分析”→“分布”;
②在弹出的对话框中,将BMI放入“Y,列”;
③在结果界面中点击BMI左侧的红色三角形按钮,在下拉菜单中选择“检验均值”;
④在弹出的对话框中的指定假设均值中填写19。
上述步骤详见《一文学会t检验的3种常用方法》。
完成以上步骤后,点击确定则输出单样本t检验结果。
若想输出单样本秩和检验结果,则继续在对话框中勾选“Wilcoxon符号秩”(图9)。

图9 单样本秩和检验操作——方法选择
结果如图10所示,结果不仅包含t检验的结果,还包含秩和检验的结果(“符号秩”部分的结果)。结果显示差异有统计学意义(检验统计量=3114.500,P<0.0001)。

图10 单样本秩和检验操作——检验结果

03配对样本的秩和检验

本例采用图2数据,分析患者化疗前后IgA是否有差异。在既往的文章中我们已经为大家讲解了配对t检验的操作步骤。
配对秩和检验的前两步操作与配对t检验相同,操作流程为:
①选择JMP菜单“分析”→“专业建模”→“配对”;
②在弹出的对话框中的“Y,配对响应”中先放化疗前IgA,再放化疗后IgA。上述步骤详见《一文学会t检验的3种常用方法》。
完成上述步骤后,在结果界面中点击“配对”旁边的红色三角形按钮,在下拉菜单中选择“Wilcoxon符号秩”,即可获得配对秩和检验的结果(图11)。

图11 配对秩和检验操作——方法选择

结果如图12所示,患者化疗前后IgA差异有统计学意义(S=-2523.0,p<0.0001)。

图12 配对秩和检验操作——检验结果图


04小结

通常情况下,组间比较的数据呈明显偏态,我们会考虑采用秩和检验而不是t检验或方差分析。很多人可能对秩和检验存在一定误解,总觉得秩和检验像是“备胎”,实际上秩和检验的效率并不低。
如果数据服从正态分布,秩和检验的检验效率比t检验、方差分析等差不了多少;而如果数据呈偏态分布,秩和检验的效率则远高于t检验和方差分析。
最后,想要在JMP中亲自动手练习的朋友,可点击这里下载最新的JMP 16免费试用。

yirannorm 发表于 2022-2-18 08:56:54

很好的学习资料

yirannorm 发表于 2022-10-22 07:50:45

非常好的学习资料

kezhang2000 发表于 2023-1-27 17:34:46

学习                        谢谢:)

kezhang2000 发表于 2023-2-2 18:18:14

:)                           学习

yirannorm 发表于 2023-2-6 07:37:07

非常好的学习资料
页: [1]
查看完整版本: 干货 | 秩和检验及其两两比较的思路与解析