如何用神经网络挑选一个好西瓜?
在炎炎的夏日里,西瓜是人们最喜爱的水果之一。西瓜清爽解渴, 果肉味甜,能降温去暑,因此在夏季里倍受人们的喜爱,堪称“盛夏之王”。然而,挑西瓜却是一门学问,好的瓜不仅能够达到降温消暑的功效,而且在口感上也是略胜一筹。那么,怎样根据西瓜的一些特征属性又快又准确地判断其好坏呢?下面,就为你介绍挑选西瓜的一种机器算法——神经网络。
什么是神经网络算法?神经网络是以人脑为基础的抽象模型。它模拟真实人脑神经网络的结构和功能,人工神经网络是由大量神经元通过极为丰富和完善的连接,以及若干基本特性的某种理论抽象、简化和模拟而构成的一种信息处理系统。
神经网络分析法是从神经心理学和认知科学研究成果出发,应用数学方法发展起来的一种具有高度并行计算能力、自学能力和容错能力的处理方法。
例如我们在根据西瓜的特征属性(色泽、根蒂、敲声、纹理、脐部、触感)判断其好坏时,神经网络模型的神经元会接收来自其他6个神经元传递过来的信号,然后通过“激活函数”得出是好瓜的概率,其结果介于0与1之间。神经元模型的关系如下图所示。
接下来,我们需要借助数据统计软件来模拟西瓜例子的生物神经网络,这个过程不仅能够得到每种瓜型是好瓜的概率,而且可以快速找到“最好的瓜”。
下图是关于西瓜的17个训练样例,包括8个好瓜和9个坏瓜,共有6个特征属性。利用这个训练数据集,在数据统计软件中选择神经网络模型,保留三分之一的数据进行验证,就可以得到结果啦。
下图是关于训练数据集和验证数据集的信息,从图中可以看到,训练集的误分类率是0.0909091,验证集的误分类率是0.1666667,说明这个神经网络模型的准确分类率较高。从混淆矩阵也可以看到实际分类与预测计数的情况。
下一步,我们要通过预测刻画器寻找“好瓜=是”的最大概率,刻画器描绘了“是否为好瓜”的概率与各个特征属性的预测曲线图。第一个刻画器显示,当“色泽=浅白,根蒂=蜷缩,敲声=沉闷,纹理=模糊,脐部=凹陷,触感=软粘”时,是好瓜的概率为0.391。
所以,我们需要改变每个特征属性的取值,从而使“好瓜=是”的概率达到最大。在每个曲线图中选择曲线的最低点,可以使“好瓜=是”的概率达到最大,结果如第二个刻画器所示。
该刻画器显示,当“色泽=青绿,根蒂=稍蜷,敲声=清脆,纹理=清晰,脐部=凹陷,触感=硬滑”时,是好瓜的概率高达0.886(即88.6%)!这也是基于我们所使用的西瓜数据所能挑到好瓜的最大概率! 通过以上的分析,相信大家都已经掌握了挑选西瓜的小窍门,希望大家在这个夏天都能挑选到好吃的西瓜!
关注JMP微信公众号,获取更多数据分析资讯:
非常有用的学习 感谢分享!
又学了一招--神经网络。下图是用JMP13试用版得出的“好瓜=是”的最大概率。我想接着应用到“黑马股”的选择中:lol 能否将这个Excel, or JMP 文件的数据表放上来,让大家学一学,更好嘛?多谢 Mujahida 发表于 2017-7-8 21:52
能否将这个Excel, or JMP 文件的数据表放上来,让大家学一学,更好嘛?多谢
自己动手输入,其实用不了多少时间。要学习,总得花点时间与精力。现上传附件。 举一反三,周末开始将JMP的神经网络功能用到部分雄安概念的中线潜力个股的选择中,结果详见下图:,接下来有待后续的验证。
JMP的功能实在是实用与Very Powerful !
感恩JMP! 先回复,后学习。:lol谢谢分享 Mujahida 发表于 2017-7-14 09:16
你的数据有问题,实现不了你的结果
因为算法抽取的训练数据与验证数据有随机性,所以是会出现不同的结果。一般来说,神经网络算法在数量较多的情况下,效果更加明显。 吃瓜群众表示非常感谢选到了好西瓜!!! wangtian4625 发表于 2017-8-6 21:44
吃瓜群众表示非常感谢选到了好西瓜!!!
安静滴做一枚吃瓜群众:handshake