JMP数据分析论坛

标题: 如何用神经网络挑选一个好西瓜? [打印本页]

作者: admin    时间: 2017-7-7 09:39
标题: 如何用神经网络挑选一个好西瓜?
在炎炎的夏日里,西瓜是人们最喜爱的水果之一。西瓜清爽解渴, 果肉味甜,能降温去暑,因此在夏季里倍受人们的喜爱,堪称“盛夏之王”。

然而,挑西瓜却是一门学问,好的瓜不仅能够达到降温消暑的功效,而且在口感上也是略胜一筹。那么,怎样根据西瓜的一些特征属性又快又准确地判断其好坏呢?下面,就为你介绍挑选西瓜的一种机器算法——神经网络。

什么是神经网络算法?
神经网络是以人脑为基础的抽象模型。它模拟真实人脑神经网络的结构和功能,人工神经网络是由大量神经元通过极为丰富和完善的连接,以及若干基本特性的某种理论抽象、简化和模拟而构成的一种信息处理系统。

神经网络分析法是从神经心理学和认知科学研究成果出发,应用数学方法发展起来的一种具有高度并行计算能力、自学能力和容错能力的处理方法。

例如我们在根据西瓜的特征属性(色泽、根蒂、敲声、纹理、脐部、触感)判断其好坏时,神经网络模型的神经元会接收来自其他6个神经元传递过来的信号,然后通过“激活函数”得出是好瓜的概率,其结果介于0与1之间。
神经元模型的关系如下图所示。
[attach]3425[/attach]

接下来,我们需要借助数据统计软件来模拟西瓜例子的生物神经网络,这个过程不仅能够得到每种瓜型是好瓜的概率,而且可以快速找到“最好的瓜”。

下图是关于西瓜的17个训练样例,包括8个好瓜和9个坏瓜,共有6个特征属性。利用这个训练数据集,在数据统计软件中选择神经网络模型,保留三分之一的数据进行验证,就可以得到结果啦。

[attach]3428[/attach]

下图是关于训练数据集和验证数据集的信息,从图中可以看到,训练集的误分类率是0.0909091,验证集的误分类率是0.1666667,说明这个神经网络模型的准确分类率较高。从混淆矩阵也可以看到实际分类与预测计数的情况。
[attach]3429[/attach]

下一步,我们要通过预测刻画器寻找“好瓜=是”的最大概率,刻画器描绘了“是否为好瓜”的概率与各个特征属性的预测曲线图。第一个刻画器显示,当“色泽=浅白,根蒂=蜷缩,敲声=沉闷,纹理=模糊,脐部=凹陷,触感=软粘”时,是好瓜的概率为0.391。

[attach]3426[/attach]

所以,我们需要改变每个特征属性的取值,从而使“好瓜=是”的概率达到最大。在每个曲线图中选择曲线的最低点,可以使“好瓜=是”的概率达到最大,结果如第二个刻画器所示。

[attach]3427[/attach]

该刻画器显示,当“色泽=青绿,根蒂=稍蜷,敲声=清脆,纹理=清晰,脐部=凹陷,触感=硬滑”时,是好瓜的概率高达0.886(即88.6%)!这也是基于我们所使用的西瓜数据所能挑到好瓜的最大概率!
通过以上的分析,相信大家都已经掌握了挑选西瓜的小窍门,希望大家在这个夏天都能挑选到好吃的西瓜!

关注JMP微信公众号,获取更多数据分析资讯:
[attach]3430[/attach]


作者: wangtian4625    时间: 2017-7-7 20:38
非常有用的学习
作者: rocluo5566    时间: 2017-7-8 11:05
感谢分享!
又学了一招--神经网络。下图是用JMP13试用版得出的“好瓜=是”的最大概率。我想接着应用到“黑马股”的选择中
作者: Mujahida    时间: 2017-7-8 21:52
能否将这个Excel, or JMP 文件的数据表放上来,让大家学一学,更好嘛?多谢
作者: rocluo5566    时间: 2017-7-9 13:13
Mujahida 发表于 2017-7-8 21:52
能否将这个Excel, or JMP 文件的数据表放上来,让大家学一学,更好嘛?多谢

自己动手输入,其实用不了多少时间。要学习,总得花点时间与精力。现上传附件。
作者: rocluo5566    时间: 2017-7-9 13:36
举一反三,周末开始将JMP的神经网络功能用到部分雄安概念的中线潜力个股的选择中,结果详见下图:,接下来有待后续的验证。
JMP的功能实在是实用与Very Powerful !
感恩JMP!
作者: 笨豆豆    时间: 2017-7-10 11:10
先回复,后学习。谢谢分享
作者: admin    时间: 2017-7-20 09:12
Mujahida 发表于 2017-7-14 09:16
你的数据有问题,实现不了你的结果

因为算法抽取的训练数据与验证数据有随机性,所以是会出现不同的结果。一般来说,神经网络算法在数量较多的情况下,效果更加明显。
作者: wangtian4625    时间: 2017-8-6 21:44
吃瓜群众表示非常感谢选到了好西瓜!!!
作者: admin    时间: 2017-8-7 10:09
wangtian4625 发表于 2017-8-6 21:44
吃瓜群众表示非常感谢选到了好西瓜!!!

安静滴做一枚吃瓜群众
作者: jackwyj    时间: 2018-2-28 16:43
本帖最后由 jackwyj 于 2018-2-28 16:55 编辑

灰常灰常感谢,我练习的图怎么图中有一列散点?

作者: ak47ok    时间: 2018-3-28 16:19
有监督学习
作者: ak47ok    时间: 2018-3-28 18:57
呵呵,将JMP的"神经"弄明白了。相当于超大正交表的运算结果。

作者: ak47ok    时间: 2018-3-28 18:58
我的选瓜胜率:98.8307%
作者: ak47ok    时间: 2018-3-29 15:00
只求胜率最好是不够的、不能看出这个组合出现的机率有多少,

作者: ak47ok    时间: 2018-3-29 15:02
这个算法是往穷尽方向发展,比DOE的试验次数多得多了,所以是能找出更好的结果

作者: 初学者小白    时间: 2018-8-13 13:57
希望楼主多更新新作呀!!广大人民群众对您有着无限期待呀!!!
作者: 军猫2020    时间: 2020-9-8 09:49
吃瓜吃瓜,这个例子非常好
作者: leitingwhat    时间: 2022-6-30 14:43
过来学习学习
作者: lixianlin    时间: 2022-7-1 09:22
可以当好吃瓜群众了
作者: Jimabby    时间: 2022-7-3 09:06
能不能发一下怎么一步一步做到的?
作者: kezhang2000    时间: 2022-7-10 18:29
学习了




欢迎光临 JMP数据分析论坛 (http://www.jmpforum.net/) X3