设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 349|回复: 1

数据清洗之“拆分” — 快速实现一列拆分为多列

[复制链接]
发表于 2020-12-8 15:14:57 | 显示全部楼层 |阅读模式
上期我们介绍了如何通过JMP的“堆叠”功能快速将多列指标合并为一列指标。相反地,在其他一些时候,你可能需要将一列或多列指标根据某个指标拆分为多列指标。比如在人口普查结果中想看看男性和女性在不同年龄段的分布。又或者,出于分析或作图的需要,如何将身高依据性别拆分为两列?
今天带大家学习的数据清洗神器之JMP“拆分”功能,就是这样一个可以快速将一列或多列指标拆分为多列指标的高效工具,有了它,就可以满足大家在不同分析情境下的不同需求。
为了帮助更多的临床医师学习如何运用JMP高效地开展数据分析,提高日常工作和发表论文的效率,2020年8月起,JMP资深用户、JMP特约专栏作者、资深统计学家冯国双博士及其团队将在JMP数据分析平台为大家分享一系列统计及数据分析、JMP实战操作、JMP分析报表解读等干货内容,每期一个经典话题,帮助大家掌握一个新技能。值得注意的是,这些话题并非仅针对临床医师,对所有运用JMP软件开展数据分析的小伙伴都适用。本文为此系列文章的第六期。

假如我们有一份重复测量数据,时间点和测量值是作为两个变量记录的,如果我们想采用重复测量方差分析探索处理和时间点的效应,那我们就必须将每一个时间点的测量值单独成列。又比如,大家常见的男女对比金字塔图,也需要将男和女的信息分列成两个变量后再进行绘制。今天我们就依据这两个例子,给大家介绍JMP的另一个实用功能——“拆分”。

首先看一下重复测量的示例数据,共15个被试者,分为三组接受不同处理,重复测量三次,数据(截取部分)如图1。
图1 重复测量示例数据

为了进行重复测量方差分析,我们需要将三个时间点的测量值根据时间点分成三列。拆分的对话框通过点击菜单栏的表→拆分触发,如图2.
图2 启动列拆分对话框

打开拆分对话框,如图3。这里,我们将时间点放入拆分依据框中,然后将测量值放入拆分列,即根据时间点对测量值进行拆分,拆分为与时间点个数相同数量的列。其余列我们可以选择全部保留,如果后续分析用不到,也可以选择全部删除,或者手动选择想保存的列。
图3 列的拆分对话框

因为拆分数据必然形成新的数据表,可为新数据表命名。用动图进行动态演示,见图4。
图4 列的拆分动态演示

拆分之后生成的新数据表如图5所示。原数据为45行,每个被试者三个时间点各占一行,拆分之后,新数据为15行,每个被试者占一行,三个时间点分别在t1-t3三列显示,这样就可以满足重复测量方差分析的数据格式要求了。
图5 列的拆分

再给大家列举两种需要用到JMP拆分功能的情形。

第一个就是我们常见的金字塔图(又称蝴蝶图),如图6所示(注:金字塔图我们常常用来发表文章,这里仅做演示,图注等已抹去)。
图6 金字塔图示例

若想做出这样的图,男性和女性的数据必须单独成列,作为两个变量,但是在正常情况下,性别往往是作为一个独立变量存在的,这时就需要用到今天讲的拆分功能。

我们以某个示例数据用动图进行展示,假设我们想作图展示男女糖尿病人的BMI值分布情况,该怎么拆分呢?如图7动图所示。

当新的数据表生成后,我们就可以作图了。至于如何制作金字塔图,敬请关注本系列后续的JMP作图专辑。

此外,还有一种情况需要用到列的拆分,那就是我们要进行配对t检验(或者配符号秩和检验)的时候,这是为什么呢?请大家开动脑筋思考下,并欢留言讨论。
列的拆分和堆叠是大家在JMP中清洗数据非常常见且实用的功能,只要你掌握了一点点其中的小技巧,学会融会贯通(根据不同情况选择不同的操作),你就会发现处理数据的效率大大提升,从而将精力花费在更关注的地方,比如后续的作图、分析等等。系列文章持续推送中,敬请期待!

如果你还未体验过JMP,欢迎点击这里下载JMP试用,跟着文章练起来吧!



回复

使用道具 举报

发表于 2020-12-29 07:47:54 | 显示全部楼层
图片始终不能显示,有问题,请版主解决。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2021-3-4 20:02 , Processed in 0.298288 second(s), 16 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表