设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 1577|回复: 0
打印 上一主题 下一主题

如何在JMP中实现正态性检验和方差齐性检验?

[复制链接]
跳转到指定楼层
楼主
发表于 2021-5-11 17:09:12 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
在上一篇文章《一个神奇的JMP菜单,实现数据的所有组间比较》,我们从总体思路上介绍了组间比较常用的方法以及JMP操作的基本特色。

本文以及后面的几篇文章中,我们将分别对几种常见的组间比较方法及其实现过程逐一展开介绍。

为了帮助更多的临床医师学习如何运用JMP高效地开展数据分析,提高日常工作和发表论文的效率,2020年8月起,JMP资深用户、JMP特约专栏作者、资深统计学家冯国双博士及其团队将在JMP数据分析平台为大家分享一系列统计及数据分析、JMP实战操作、JMP分析报表解读等干货内容,每期一个经典话题,帮助大家掌握一个新技能。值得注意的是,这些话题并非仅针对临床医师,对所有运用JMP软件开展数据分析的小伙伴都适用。本文为此系列文章的第11期。
今天的文章将从连续变量的组间比较说起。首先建议大家回顾一下下图。

对于连续变量的组间比较,如果要选择合理的分析方法,有几个前提条件必须先考虑,即正态性和方差齐性。

01 什么是正态性和方差齐性?
众所周知,常见的数据分布形态有正态分布、泊松分布、指数分布等,正态性检验指判断总体是否服从正态分布的检验。方差齐性检验是对各组样本间方差是否相同进行的检验。
在连续变量组间比较的实际应用中,很多临床医师常犯的错误就是不考虑数据是否正态或是否方差齐,而是直接使用t检验或方差分析对数据进行统计分析

有的朋友甚至还有一些所谓的“证据支持”,比如:统计书上说了,样本量大于30数据就是正态分布,我的样本数是50,所以不用做正态性检验;或者说:别人的文章跟我当前分析的是同一个指标,他们用的就是t检验。事实上,统计书上从来没有说过样本例数多了就不用做正态性检验,而别人的研究更不足以作为你犯错的依据。正确的做法是,一定要在选择方法之前看一下你的数据分布到底是什么样子。

本文的内容就是介绍在选择统计方法之前需要考虑的两个重要条件:如何判断数据是否满足正态分布、如何判断组间的方差是否相等。只有确定了这两个条件,才能选择合理的分析方法。


02 在JMP中实现正态性检验
接下来,我们来看一下如何在JMP中使用“分布”平台实现正态性检验。

以图1的数据为例,探索吸烟与不吸烟人群的BMI值是否存在差异,首先需对BMI值进行正态性检验,然后根据数据分布情况判断应该使用t检验还是秩和检验。


图1 本文所用的数据


需要注意的是,在进行组间比较时,需分组进行正态性检验,即分别检验吸烟与不吸烟两组人群BMI的分布,而不是检验所有人BMI数值的分布情况。

接下来为大家讲解如何进行具体操作,首先选择“分析”→“分布”(图2)。

图2 正态性检验操作示意图第一步

因为我们要探索吸烟和不吸烟的两组人群的BMI分布情况,因此BMI为结果,吸烟为分组。所以在对话框中将BMI放入“Y,列”;将吸烟放入“依据”(图3)。输出结果见图4。

图3正态性检验操作示意图第二步


图4 输出结果

JMP中经常会看到“依据”,它表示“分别”或“分层”的意思,例如将吸烟拖入依据,表示分别对吸烟人群和不吸烟人群执行操作。这与“分组”意思不同,分组表示组间比较,如比较吸烟人群和不吸烟人群的差异。在后续的文章中,我们还会对这一概念进行解释。

如果对这种竖向放置的直方图不习惯,想将直方图横过来,可在结果界面点击“分布 吸烟=吸烟”左侧的红色三角形按钮,在下拉菜单中选择“堆叠”(图5)。


图5 堆叠操作示意图

输出结果如图6所示。这里分别给出吸烟与不吸烟两组人群的BMI的各类统计量,包括均值、标准差、中位数、上下四分位数等等。

图6 输出结果


在“分布 吸烟=吸烟”的内容下点击“BMI”左侧的红色三角形按钮,在下拉菜单中点击“连续拟合”→“拟合正态”(图7)。

图7 正态性检验操作示意图第三步

正态拟合的结果见图8。


图8 输出结果


点击正态拟合左侧的红色三角形按钮,在下拉菜单中点击“拟合优度”(图9),便会显示正态性检验结果。

图9 正态性检验操作示意图第四步


正态性检验结果如图10所示,p值等于0.9128,大于0.05,不能认为不满足正态分布,即无法得出“数据不服从正态分布”这一结论,因此可将数据视为正态分布进行分析。

图10 正态性检验结果


不吸烟人群BMI的正态性检验操作方式同上,结果见图11,为非正态分布。

图11 正态性检验结果


根据上面的正态性检验结果,我们可以确定应使用秩和检验进行组间比较。因为两组数据中只要有任意一组数据为非正态分布,就需使用秩和检验进行组间比较。

03 在JMP中实现方差齐性检验
如果在进行组间比较时,发现两组数据均为正态分布,此时并不意味着就可以直接进行t检验了,还需要进行方差齐性检验,以确定应该使用t检验还是校正的t检验(t’检验)。

方差齐性检验是对组间方差是否相同进行的检验。什么要做方差齐性检验?因为在进行组间比较时,如果组间方差差别太大,将会掩盖掉均值的差异,导致错误的结论。

方差齐性检验常用的方法有:F双边检验、Brown-Forsythe检验、Levene检验、Bartlett检验和O’Brien检验。其中F双边检验用于两组数据的方差齐性检验;其它用于多组数据的方差齐性检验,实际中以Levene法和Bartlett法较为常用,但Bartlett法只能用于正态数据,Levene法还可用于非正态数据,应用范围更广一些。

以图1数据为例,若分析不同呼吸困难程度的人躯体健康评分是否有差异,则首先进行正态性检验,若检验结果发现两组数据均为正态分布,接下来则进行方差齐性检验。

方差齐性检验作为组间比较的重要步骤,其操作在JMP菜单“以X拟合Y”模块中实现。在前一篇文章中我们已经对组间比较的操作进行了简单介绍。

选择“分析”→“以X拟合Y”。本例中躯体健康评分为结果,呼吸困难程度为分组。所以在对话框中将躯体健康评分放入“Y,响应”,将呼吸困难程度放入“X,因子”,操作见图12。


图12 差异性检验操作


点击“呼吸困难-躯体健康评分”单因子分析旁边的红色三角形按钮,在下拉菜单中选择“不等方差”(图13)。

图13 方差齐性检验操作


输出结果见图14,若方差齐性检验的p值大于0.05,可以认为方差齐(严格来说应该是没有足够证据认为组间方差不齐)。

本案例为两组方差齐性的检验,可选择任一检验结果(因为两组是多组的特例),结果显示两组方差不齐(各检验结果均显示P<0.05),则后续应采用校正的t检验(t’检验)。

注意:如果是多组数据的方差齐性检验,则结果中不会出现F双边检验的结果。

图14 方差齐性检验结果


以上就是今天分享的基于JMP的正态性检验和方差齐性检验的一些方法与注意事项。如果你也想体验运用JMP轻松实现正态性检验和方差齐性检验,欢迎下载JMP免费试用,跟着文章练起来吧。在下期文章中,我们将介绍如何在JMP中开展t检验。


分享到:  !connect_viewthread_share_to_qq!!connect_viewthread_share_to_qq! QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 支持支持 反对反对
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-5-5 11:44 , Processed in 0.370596 second(s), 16 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表