设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 1398|回复: 0
打印 上一主题 下一主题

如何在JMP Pro中使用Neural platform进行验证列自动创建

[复制链接]
跳转到指定楼层
楼主
发表于 2014-4-11 10:20:39 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
翻译过来的一篇文章,不足之处还请见谅,仅供参考~
JMP Pro是用于快速构建多个模型的一种强大的工具。当建立预测模型,你需要可靠的方式来验证你的模型,否则你可以很容易地陷入困境过度拟合。JMP中许多建模平台专业版支持验证列。验证列用于训练和验证部分分割你的数据了。训练数据用于构建模型,并验证数据是用来调整模型。有时,第三个分裂 - 测试 - 被用来模拟进来了,这样你可能会看到用以前模型执行看不见的新数据。

比方说,你想用70 %的数据来构建模型,并节省30 %的验证或微调模式。你可能会认为,考虑到所有的行进行随机抽样可能是最好的一段路要走 - 但很容易导致问题,如果你正在处理大量的异常值或一个罕见的事件。一个简单随机样本可以很容易地将所有重要的数据点(如罕见的事件)在训练集和验证集。这将创建最理想的建模条件,并可能导致你建立的模型是不是非常有用。

JMPPro中的Neural platform可以帮助你在短短的几个步骤自动创建一个公正且平衡的验证列。 Sample Data).">这里使用的是波士顿房屋数据集,这是在JMP中的示例数据(帮助>样本数据) 。对于这个数据,我想预测基于多种可能的预测房子的mvalue 。下面的分布表明,反应具有一批高mvalues ​​,我们要确保被均分到我们的训练和验证集。

在Neural Model Launch中,我可以为验证方法指定一个保留金比例。因为我希望有一个70/30拆分,我就把.3放进该区域。Neuralplatform将自动从最低到最高值排序,然后随机把记录分配给无论是基于我的比例期望的培训还是验证集。



我实际不是在神经网络模型在这里特别感兴趣,所以我可以接受默认值,然后单击:GO。然后从上拟合的红色三角形菜单,我会选择“保存验证”选项。




这将在我的数据表中自动创建一个新的验证柱,每一行都会标记“培训”或“验证”。


如果我们再次通过验证来看看其对应的分配,你可以看到,训练和验证集的性质非常接近。
Neuralplatform做了项伟大的工作,以一种智能的方式自动地对我的数据做了分割。



现在,我已经准备好着手建立我的模型 - 我知道我有一个坚实的数据分割方案,可以让我建立我的资料最翔实和有用的模型。无疑在JMP Pro中建立的验证列,我已经发现迄今最快捷,最可靠的方式。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
分享到:  !connect_viewthread_share_to_qq!!connect_viewthread_share_to_qq! QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 支持支持 反对反对
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-5-6 02:22 , Processed in 0.360763 second(s), 17 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表