JMP数据分析论坛

标题: JMP14初体验之—“多文件导入平台”! [打印本页]

作者: admin    时间: 2018-4-26 14:36
标题: JMP14初体验之—“多文件导入平台”!
4月初,我们为大家介绍了一位资深粉丝带来的JMP14初体验,今天,我们就继续为大家带来小工具,大用途——JMP 14的多文件导入平台。

无论你是数据分析领域的资深玩家、还是初出茅庐的新手,有时会面临这样的窘境,特别是数据集中化管理还未完成的情况下,所要分析的大量数据分散在一个个单独的测试档案之中。

每个文件多以产品的序列号,批次或时间来命名。而且随着测试的时间推移,文件的数量也不断的增长。数量少的情况下通过统计分析软件,多操作几步,花些体力还能够接受。一旦有成千上万的文件要做这样的处理,就会让很多小伙伴联想到一部知名的电影“Mission Impossible”. 一如影片中纵使任务面临艰难险阻,阿汤哥总能够巧妙地化险为夷,JMP14的诞生为解决这个棘手的问题带来了新的希望。

下面,我们就一起来看看JMP14的“多文件导入平台”如何在处理大量数据文件处理中大显身手!

我们以一个简单的例子与大家来分享下。本次我们的任务是需要从“D:\Data\Multiple Text File”路径的多个文本文件中提取测试数据,并且整合到一个数据文件。这些数据是以产品的序列号命名的,比如SN1.txt、SN2.txt等。

在主菜单“文件”下启动“多文件导入平台”,选择指定的文件目录后,就可以开始着手导入数据文件的工作。但是在文件列表中不难发现,这个路径中不仅是包含有我们所需要导入的数据文件,也有其他的文档也参杂在其中,显然不是我们所期望的。这时,在平台中文件筛选功能就有用武之地了!

明确我们的目标文件是以产品序列号命名的文本文档,它们以“SN”为开始,后缀为“txt”,勾选“按名称或扩展名选择文件”的功能,然后输入“SN*.txt”按下回车,即刻会发现其它无关的文件就会变灰色,也就是此次数据导入过程会将其排除在外。

[attach]3852[/attach]


另外两个文件筛选的方式有时也能够恰到好处。“按大小选择文件”大于零的能够排除空的文件,避免无效的文档输入;“按日期和时间选择文件”能够快速锁定感兴趣的时间段的数据文件。

[attach]3853[/attach]


一切准备就绪,点击“导入”按钮,就可以将五个文件中的数据一次性整合成一个数据表格,特别是文件数量多的时候,“多文件导入平台”提供了极为高效的数据获取方法。

当我们沉浸在JMP化解以往艰巨任务的喜悦中时,也别忘了确认一下最终的结果是否满足分析的要求。

[attach]3854[/attach]


从上图中不难发现:的确,SN1到SN5全部文件的1495笔资料都已经顺利载入了。不过细心的小伙伴也许就会发现不足了。

我们常说分析问题“5W”一个都不能少,整合后的数据看不出来是来自于哪个序列号代表的产品,要是能够将序列号的信息能够添加到数据表格就好了。另外时间的信息对于分析产品指标的发展趋势,解决现场问题也是不可或缺的,产品测试的时间跟文档生成的时间是近似的等等情况。

还好这些情境在“多文件导入平台”中都照顾到了。只需导入之前,在“多文件导入”平台界面的左下角勾选“添加文件名列”与“添加文件日期列”的选项即可如愿了。

[attach]3855[/attach]


希望借助于JMP14的 “多文件导入平台”,让大家可以离自如地开展自己的大数据分析工作。


关注JMP微信公众号,了解更多JMP相关资讯及应用:








欢迎光临 JMP数据分析论坛 (http://www.jmpforum.net/) X3