本文以及后面的几篇文章中,我们将分别对几种常见的组间比较方法及其实现过程逐一展开介绍。
为了帮助更多的临床医师学习如何运用JMP高效地开展数据分析,提高日常工作和发表论文的效率,2020年8月起,JMP资深用户、JMP特约专栏作者、资深统计学家冯国双博士及其团队将在JMP数据分析平台为大家分享一系列统计及数据分析、JMP实战操作、JMP分析报表解读等干货内容,每期一个经典话题,帮助大家掌握一个新技能。值得注意的是,这些话题并非仅针对临床医师,对所有运用JMP软件开展数据分析的小伙伴都适用。本文为此系列文章的第11期。 今天的文章将从连续变量的组间比较说起。首先建议大家回顾一下下图。
对于连续变量的组间比较,如果要选择合理的分析方法,有几个前提条件必须先考虑,即正态性和方差齐性。
01 什么是正态性和方差齐性?
众所周知,常见的数据分布形态有正态分布、泊松分布、指数分布等,正态性检验指判断总体是否服从正态分布的检验。方差齐性检验是对各组样本间方差是否相同进行的检验。 在连续变量组间比较的实际应用中,很多临床医师常犯的错误就是不考虑数据是否正态或是否方差齐,而是直接使用t检验或方差分析对数据进行 统计分析。
有的朋友甚至还有一些所谓的“证据支持”,比如:统计书上说了,样本量大于30数据就是正态分布,我的样本数是50,所以不用做正态性检验;或者说:别人的文章跟我当前分析的是同一个指标,他们用的就是t检验。事实上,统计书上从来没有说过样本例数多了就不用做正态性检验,而别人的研究更不足以作为你犯错的依据。正确的做法是,一定要在选择方法之前看一下你的数据分布到底是什么样子。
本文的内容就是介绍在选择统计方法之前需要考虑的两个重要条件:如何判断数据是否满足正态分布、如何判断组间的方差是否相等。只有确定了这两个条件,才能选择合理的分析方法。
02 在JMP中实现正态性检验
接下来,我们来看一下如何在JMP中使用“分布”平台实现正态性检验。
以图1的数据为例,探索吸烟与不吸烟人群的BMI值是否存在差异,首先需对BMI值进行正态性检验,然后根据数据分布情况判断应该使用t检验还是秩和检验。
图1 本文所用的数据
需要注意的是,在进行组间比较时,需分组进行正态性检验,即分别检验吸烟与不吸烟两组人群BMI的分布,而不是检验所有人BMI数值的分布情况。
接下来为大家讲解如何进行具体操作,首先选择“分析”→“分布”(图2)。
图2 正态性检验操作示意图第一步
因为我们要探索吸烟和不吸烟的两组人群的BMI分布情况,因此BMI为结果,吸烟为分组。所以在对话框中将BMI放入“Y,列”;将吸烟放入“依据”(图3)。输出结果见图4。
图3正态性检验操作示意图第二步
图4 输出结果
JMP中经常会看到“依据”,它表示“分别”或“分层”的意思,例如将吸烟拖入依据,表示分别对吸烟人群和不吸烟人群执行操作。这与“分组”意思不同,分组表示组间比较,如比较吸烟人群和不吸烟人群的差异。在后续的文章中,我们还会对这一概念进行解释。
如果对这种竖向放置的直方图不习惯,想将直方图横过来,可在结果界面点击“分布 吸烟=吸烟”左侧的红色三角形按钮,在下拉菜单中选择“堆叠”(图5)。
图5 堆叠操作示意图
输出结果如图6所示。这里分别给出吸烟与不吸烟两组人群的BMI的各类统计量,包括均值、标准差、中位数、上下四分位数等等。
图6 输出结果
在“分布 吸烟=吸烟”的内容下点击“BMI”左侧的红色三角形按钮,在下拉菜单中点击“连续拟合”→“拟合正态”(图7)。
图7 正态性检验操作示意图第三步
正态拟合的结果见图8。
图8 输出结果
点击正态拟合左侧的红色三角形按钮,在下拉菜单中点击“拟合优度”(图9),便会显示正态性检验结果。
图9 正态性检验操作示意图第四步
正态性检验结果如图10所示,p值等于0.9128,大于0.05,不能认为不满足正态分布,即无法得出“数据不服从正态分布”这一结论,因此可将数据视为正态分布进行分析。
图10 正态性检验结果
不吸烟人群BMI的正态性检验操作方式同上,结果见图11,为非正态分布。
图11 正态性检验结果
根据上面的正态性检验结果,我们可以确定应使用秩和检验进行组间比较。因为两组数据中只要有任意一组数据为非正态分布,就需使用秩和检验进行组间比较。
03 在JMP中实现方差齐性检验
如果在进行组间比较时,发现两组数据均为正态分布,此时并不意味着就可以直接进行t检验了,还需要进行方差齐性检验,以确定应该使用t检验还是校正的t检验(t’检验)。
方差齐性检验是对组间方差是否相同进行的检验。什么要做方差齐性检验?因为在进行组间比较时,如果组间方差差别太大,将会掩盖掉均值的差异,导致错误的结论。
方差齐性检验常用的方法有:F双边检验、Brown-Forsythe检验、Levene检验、Bartlett检验和O’Brien检验。其中F双边检验用于两组数据的方差齐性检验;其它用于多组数据的方差齐性检验,实际中以Levene法和Bartlett法较为常用,但Bartlett法只能用于正态数据,Levene法还可用于非正态数据,应用范围更广一些。
以图1数据为例,若分析不同呼吸困难程度的人躯体健康评分是否有差异,则首先进行正态性检验,若检验结果发现两组数据均为正态分布,接下来则进行方差齐性检验。
方差齐性检验作为组间比较的重要步骤,其操作在JMP菜单“以X拟合Y”模块中实现。在 前一篇文章中我们已经对组间比较的操作进行了简单介绍。
选择“分析”→“以X拟合Y”。本例中躯体健康评分为结果,呼吸困难程度为分组。所以在对话框中将躯体健康评分放入“Y,响应”,将呼吸困难程度放入“X,因子”,操作见图12。
图12 差异性检验操作
点击“呼吸困难-躯体健康评分”单因子分析旁边的红色三角形按钮,在下拉菜单中选择“不等方差”(图13)。
图13 方差齐性检验操作
输出结果见图14,若方差齐性检验的p值大于0.05,可以认为方差齐(严格来说应该是没有足够证据认为组间方差不齐)。
本案例为两组方差齐性的检验,可选择任一检验结果(因为两组是多组的特例),结果显示两组方差不齐(各检验结果均显示P<0.05),则后续应采用校正的t检验(t’检验)。
注意:如果是多组数据的方差齐性检验,则结果中不会出现F双边检验的结果。
图14 方差齐性检验结果
以上就是今天分享的基于JMP的正态性检验和方差齐性检验的一些方法与注意事项。如果你也想体验运用JMP轻松实现正态性检验和方差齐性检验, 欢迎下载JMP免费试用,跟着文章练起来吧。在下期文章中,我们将介绍如何在JMP中开展t检验。
|