设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 1174|回复: 0
打印 上一主题 下一主题

JMP14初体验之—“多文件导入平台”!

[复制链接]
跳转到指定楼层
楼主
发表于 2018-4-26 14:36:43 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
4月初,我们为大家介绍了一位资深粉丝带来的JMP14初体验,今天,我们就继续为大家带来小工具,大用途——JMP 14的多文件导入平台。

无论你是数据分析领域的资深玩家、还是初出茅庐的新手,有时会面临这样的窘境,特别是数据集中化管理还未完成的情况下,所要分析的大量数据分散在一个个单独的测试档案之中。

每个文件多以产品的序列号,批次或时间来命名。而且随着测试的时间推移,文件的数量也不断的增长。数量少的情况下通过统计分析软件,多操作几步,花些体力还能够接受。一旦有成千上万的文件要做这样的处理,就会让很多小伙伴联想到一部知名的电影“Mission Impossible”. 一如影片中纵使任务面临艰难险阻,阿汤哥总能够巧妙地化险为夷,JMP14的诞生为解决这个棘手的问题带来了新的希望。

下面,我们就一起来看看JMP14的“多文件导入平台”如何在处理大量数据文件处理中大显身手!

我们以一个简单的例子与大家来分享下。本次我们的任务是需要从“D:\Data\Multiple Text File”路径的多个文本文件中提取测试数据,并且整合到一个数据文件。这些数据是以产品的序列号命名的,比如SN1.txt、SN2.txt等。

在主菜单“文件”下启动“多文件导入平台”,选择指定的文件目录后,就可以开始着手导入数据文件的工作。但是在文件列表中不难发现,这个路径中不仅是包含有我们所需要导入的数据文件,也有其他的文档也参杂在其中,显然不是我们所期望的。这时,在平台中文件筛选功能就有用武之地了!

明确我们的目标文件是以产品序列号命名的文本文档,它们以“SN”为开始,后缀为“txt”,勾选“按名称或扩展名选择文件”的功能,然后输入“SN*.txt”按下回车,即刻会发现其它无关的文件就会变灰色,也就是此次数据导入过程会将其排除在外。




另外两个文件筛选的方式有时也能够恰到好处。“按大小选择文件”大于零的能够排除空的文件,避免无效的文档输入;“按日期和时间选择文件”能够快速锁定感兴趣的时间段的数据文件。




一切准备就绪,点击“导入”按钮,就可以将五个文件中的数据一次性整合成一个数据表格,特别是文件数量多的时候,“多文件导入平台”提供了极为高效的数据获取方法。

当我们沉浸在JMP化解以往艰巨任务的喜悦中时,也别忘了确认一下最终的结果是否满足分析的要求。




从上图中不难发现:的确,SN1到SN5全部文件的1495笔资料都已经顺利载入了。不过细心的小伙伴也许就会发现不足了。

我们常说分析问题“5W”一个都不能少,整合后的数据看不出来是来自于哪个序列号代表的产品,要是能够将序列号的信息能够添加到数据表格就好了。另外时间的信息对于分析产品指标的发展趋势,解决现场问题也是不可或缺的,产品测试的时间跟文档生成的时间是近似的等等情况。

还好这些情境在“多文件导入平台”中都照顾到了。只需导入之前,在“多文件导入”平台界面的左下角勾选“添加文件名列”与“添加文件日期列”的选项即可如愿了。




希望借助于JMP14的 “多文件导入平台”,让大家可以离自如地开展自己的大数据分析工作。


关注JMP微信公众号,了解更多JMP相关资讯及应用:



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
分享到:  !connect_viewthread_share_to_qq!!connect_viewthread_share_to_qq! QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 支持支持 反对反对
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-4-26 20:01 , Processed in 0.378435 second(s), 17 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表