在之前的文章中,我们介绍了组间比较的基本操作,并在上期文章中详细介绍了t检验在JMP中的实现。t检验是用于检验两组均值差异的统计方法,而本文要讲的则是用于检验多组均值差异的统计方法——方差分析。
为了帮助更多的临床医师学习如何运用JMP高效地开展数据分析,提高日常工作和发表论文的效率,2020年8月起,JMP资深用户、JMP特约专栏作者、资深统计学家冯国双博士及其团队将在JMP数据分析平台为大家分享一系列统计及数据分析、JMP实战操作、JMP分析报表解读等干货内容,每期一个经典话题,帮助大家掌握一个新技能。值得注意的是,这些话题并非仅针对临床医师,对所有运用JMP软件开展数据分析的小伙伴都适用。本文为此系列文章的第13期。
在本文中,我们以图1的数据为例进行讲解。
图1 样例数据
方差分析的基本思想是把全部观察值的总变异分解成组间变异和误差变异,然后将组间变异与随机误差进行比较,从而判断总体均数间的差别是否具有统计学意义。
方差分析是t检验的更一般性的推广,t检验可以看做是方差分析的特例。
因此使用方差分析的前提条件与t检验一致: ①各个样本是相互独立的; ②各组数据服从正态分布; ③各组间的方差相等,即方差齐。
方差分析只能得出组间有差异的结论,然而具体哪几组之间有差异,仍需要进一步统计分析,这时就需要用到两两比较。
常见的两两比较方法有Bonferroni法、Tukey’ HSD法和Dunnett法。
Bonferroni法的思路为在进行两两比较时调整检验水准。通常组间比较以0.05作为检验水准,但在两两比较时,每次比较就会有5%的概率发生I类错误。
Bonferroni法的思路就是通过将0.05除以要比较的次数,降低检验水准,从而减少假阳性错误。如4组两两比较共需比较6次,则两两比较的检验水准需调整为0.05/6=0.0083,即认为p<0.0083才算有统计学差异。但是该方法在比较次数较多时不太适合使用,因为校正后的检验水准会过小。
Tukey法是常用的两两比较方法,该方法曾经只能用于各组例数相等的情形,后来提出了改进的Tukey法,可用于各组例数不等的情形。JMP软件提供的就是改进的Tukey法,该方法可作为两两比较的首选方法。
Dunnett t检验专门用于比较1个对照组和多个试验组间的差异,试验组之间不做比较。
01 JMP中的方差分析
图1数据中,拟比较不同心功能分级患者的躯体健康评分是否存在差异,心功能分级分为1-4四级,因此这是一个4组间的比较,不能直接用t检验,而应考虑多组比较的方法。
首先通过点选JMP菜单“分析→以X拟合Y”(图2),进入组间差异比较的界面。
图2 方差分析操作——菜单选择
本例中躯体健康评分为结果,心功能分级为分组,因此在对话框中将躯体健康评分放入“Y,响应”,将心功能分级放入“X,因子”(图3)。
图3 方差分析操作——变量选择
正态性检验结果显示各组数据均为正态分布。方差齐性检验结果见图4。多组数据的方差齐性检验多用Bartlett检验和Levene检验。Bartlett检验主要用于正态分布的数据,Levene检验多用于数据不满足正态分布的情形。
本例中数据为正态分布,采用Bartlett检验结果,结果显示方差不齐(P=0.0224)。
图4 方差齐性检验结果
Welch方差分析结果见方差齐性检验结果的最后一部分(图5)。结果显示四组间躯体健康评分的差异有统计学意义(F=40.2951,P<0.0001)。
图5 Welch方差分析输出结果
如果数据满足正态性且方差齐,则可直接采用方差分析,尽管从条件来看,本例数据应该用Welch检验,但作为示例,我们同时也介绍一下方差分析的结果如何输出。点击“心功能分级-躯体健康评分”单因子分析旁边的红色三角形按钮,在下拉菜单中选择“均值/方差分析”(图6)。
图6 方差分析操作——方法选择
输出结果见图7,方差分析结果表明四组的躯体健康评分差异有统计学意义(F=16.0080,P<0.0001)。
图7 方差分析输出结果
从上述分析结果可以看出,方差分析的F值与Welch检验结果有一定的差异。因此对于连续变量的组间比较一定要综合考虑其正态性和方差齐性。
02 JMP中的两两比较
如果总的方差分析结果显示无统计学差异,提示各组间均无统计学差异,则无需做两两比较。
但如果总的组间比较结果显示四组的差异有统计学意义,那么通常还需要进行组间两两比较,以明确具体是哪两组之间有差异。
JMP中正态性数据两两比较比较操作在比较均值选项中完成操作,由于我们要比较任意两组之间的差异,可选择Tukey法。
点击“心功能分级-躯体健康评分”单因子分析旁边的红色三角形按钮,在下拉菜单中选择“比较均值→所有对,Tukey HSD”,操作见图8。
图8 两两比较操作
输出结果见图9,结果显示除了心功能分级3和4间无差异,其它组之间都有统计学差异。本例分析结果表明,不同心功能分级人群的躯体健康评分差异有统计学意义(F=16.0080,P<0.0001),除了心功能分级3和4间无差异,其它心功能分级之间的差异都有统计学意义。
图9 两两比较输出结果图
|