设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 219|回复: 0

利用公式生成新计算的变量

[复制链接]
发表于 2020-12-25 15:01:00 | 显示全部楼层 |阅读模式
数据整理及分析中经常遇到需要根据现有变量生成新变量的情况,比如将连续型的年龄划分为年龄段,将BMI的具体值转换为“标准”、“超重”等分组,提取地址变量中的某个字段,提取时间变量中的年月日等等。在常用的一些编程统计分析软件中,我们需要记住一些函数才能够实现。而在JMP中,这些需求都可以通过清晰直观的“公式编辑器”点击操作实现,某些甚至可以一键生成。今天这篇文章我们将介绍几个平时分析中最常用的情境,帮助大家直观感受JMP生成新变量的方便与快捷。

为了帮助更多的临床医师学习如何运用JMP高效地开展数据分析,提高日常工作和发表论文的效率,2020年8月起,JMP资深用户、JMP特约专栏作者、资深统计学家冯国双博士及其团队将在JMP数据分析平台为大家分享一系列统计及数据分析、JMP实战操作、JMP分析报表解读等干货内容,每期一个经典话题,帮助大家掌握一个新技能。值得注意的是,这些话题并非仅针对临床医师,对所有运用JMP软件开展数据分析的小伙伴都适用。本文为此系列文章的第七期。

如何利用 “公式编辑器”生成新变量?
示例数据选取JMP自带样本数据库中的Diabetes数据,如图1。

1JMP样本库自带示例数据Diabetes


1.1插入新变量
假设我们要根据BMI产生分类变量。

首先,创建一个新变量用来指示分组。这里有两种方式,第一种是在任何一个变量顶部变量名处单击右键弹出菜单选择插入列,如图2;第二种是在空列处双击左键,如图3。
插入新变量后,我们可以在该列名处单击右键进行列信息的设置,包括变量名称及类型等(关于变量名称的转换,可点击这里回顾)。这里我们将该变量命名为[BMI分组],变量类型设置为名义变量。

2 插入新变量(方式1



3插入新变量(方式2


1.2 编辑公式
假设将BMI分为三组:正常为<25,超重为25-<30,肥胖为>=30,我们需要利用条件公式,也就是常说的if-then创建新变量。那么在JMP中如何实现呢?
首先,我们在BMI分组变量名处右键菜单中选择【公式…】,即弹出针对该变量的公式编辑对话框,如图4所示。

4公式编辑器界面

通过JMP中的条件和比较两部分语句,我们可以生成BMI的分组变量,具体操作步骤如图5和图6。注意:双箭头后面的0、 1、 2是我们给分类的命名,分类名称不局限于数字,我们还可以给分类命名为“正常”、“超重”、“肥胖”。


5条件语句操作步骤(1



6 条件语句操作步骤(2

公式编辑完毕之后,点击应用,确定,即可生成BMI分组变量,如图7所示。

7生成BMI分组变量


如何利用“新建公式列”快速生成新变量?

可能有的朋友觉得这样编辑公式也很麻烦,希望有更简便的操作,确实是有的,JMP将一些常用的公式集合成了快捷选项,可以通过在变量名处单击鼠标右键触发,达到一键生成新变量的目的,但需要注意的是,不是所有的公式都有,比如上面讲到的按照一定条件分组的操作,还是必须将条件公式输入进去才能生成满足需求的新变量。

那么这个快捷选项怎么操作呢?我们这里举两个例子,示例数据是2019年我国部分城市空气气象数据,见图8。

图8示例数据


2.1 一键提取日期变量中的月份等信息
在date变量名处单击右键,然后如图9所示依次选择新建公式列→日期时间→月,点击后,即生成月份列,并自动命名为【月】,如图10所示。

图9一键提取日期中的月份(1)


10一键提取日期中的月份(2

从图9中,我们还可以看到,步骤3中,除了可以选择月,还可以选择年、季度、周、星期等,可以一键提取出我们想要的日期信息,在我们进行时间序列相关的分析时,你会发现这些快捷选项非常实用。感兴趣的话可以每一个功能都实际操作一下看看效果。

2.2 一键实现变量变换
新建公式列选项中除了日期相关的提取,更多的是关于连续型变量的变量变换,如图11中,我们可以直接在新列中对选取列进行四舍五入、平方、对数变换、指数变换等操作。

11一键实现变量变换(1

还有针对多列的计算,比如新建公式列→合并→求和,可以得到多个列的加和值,如图12,其他的选项感兴趣的朋友们也可以一一尝试下。

12一键实现变量变换(2

此外,我们甚至可能一键进行更复杂的变换,如图13所示,我们可以针对目标列进行一键中心化、标准化、显示秩次,甚至Box-Cox变换,当然这些操作都需要建立在一个清晰的分析目的基础上。

13一键实现变量变换(3

今天的文章我们分享了如何根据现有变量生成满足分析需要的新变量,展示了JMP中方便又快捷的“公式编辑器”和“新建公式列”的强大功能,希望可以帮助大家在数据清洗的过程中事半功倍。但需要强调下的是,这里只是列举了几个比较常用的情况,还有非常多且同样实用的但本文没有具体介绍的公式和选项,希望大家使用一些样本数据多进行尝试和练习,体会无需编程也能快速便捷实现数据转换的目的。

如果你也想体验JMP生成新变量的小技巧,欢迎下载JMP 30天免费试用



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2021-3-4 21:36 , Processed in 0.312905 second(s), 18 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表