在炎炎的夏日里,西瓜是人们最喜爱的水果之一。西瓜清爽解渴, 果肉味甜,能降温去暑,因此在夏季里倍受人们的喜爱,堪称“盛夏之王”。
然而,挑西瓜却是一门学问,好的瓜不仅能够达到降温消暑的功效,而且在口感上也是略胜一筹。那么,怎样根据西瓜的一些特征属性又快又准确地判断其好坏呢?下面,就为你介绍挑选西瓜的一种机器算法——神经网络。
什么是神经网络算法? 神经网络是以人脑为基础的抽象模型。它模拟真实人脑神经网络的结构和功能,人工神经网络是由大量神经元通过极为丰富和完善的连接,以及若干基本特性的某种理论抽象、简化和模拟而构成的一种信息处理系统。
神经网络分析法是从神经心理学和认知科学研究成果出发,应用数学方法发展起来的一种具有高度并行计算能力、自学能力和容错能力的处理方法。
例如我们在根据西瓜的特征属性(色泽、根蒂、敲声、纹理、脐部、触感)判断其好坏时,神经网络模型的神经元会接收来自其他6个神经元传递过来的信号,然后通过“激活函数”得出是好瓜的概率,其结果介于0与1之间。 神经元模型的关系如下图所示。
接下来,我们需要借助数据统计软件来模拟西瓜例子的生物神经网络,这个过程不仅能够得到每种瓜型是好瓜的概率,而且可以快速找到“最好的瓜”。
下图是关于西瓜的17个训练样例,包括8个好瓜和9个坏瓜,共有6个特征属性。利用这个训练数据集,在数据统计软件中选择神经网络模型,保留三分之一的数据进行验证,就可以得到结果啦。
下图是关于训练数据集和验证数据集的信息,从图中可以看到,训练集的误分类率是0.0909091,验证集的误分类率是0.1666667,说明这个神经网络模型的准确分类率较高。从混淆矩阵也可以看到实际分类与预测计数的情况。
下一步,我们要通过预测刻画器寻找“好瓜=是”的最大概率,刻画器描绘了“是否为好瓜”的概率与各个特征属性的预测曲线图。第一个刻画器显示,当“色泽=浅白,根蒂=蜷缩,敲声=沉闷,纹理=模糊,脐部=凹陷,触感=软粘”时,是好瓜的概率为0.391。
所以,我们需要改变每个特征属性的取值,从而使“好瓜=是”的概率达到最大。在每个曲线图中选择曲线的最低点,可以使“好瓜=是”的概率达到最大,结果如第二个刻画器所示。
该刻画器显示,当“色泽=青绿,根蒂=稍蜷,敲声=清脆,纹理=清晰,脐部=凹陷,触感=硬滑”时,是好瓜的概率高达0.886(即88.6%)!这也是基于我们所使用的西瓜数据所能挑到好瓜的最大概率! 通过以上的分析,相信大家都已经掌握了挑选西瓜的小窍门,希望大家在这个夏天都能挑选到好吃的西瓜!
|