出于个人兴趣泛读了下您的附件文献。
首先,是对于疑问处的个人理解。
1. 作者在文中也提到了,在机器学习中,通常以训练集(书本)训练模型,验证集(作业)进行模型诊断调优,测试集(考试)进行终极考核评价,来防止观测数据既是运动员又是裁判员的问题。2. 因此,提问所指的“...five additional experiments were performed....interrogation of the model”,在某种程度上相当于测试集的意思,即用10次实验训练“不同”模型,再分别用到这5次额外实验上进行测试,从而评估不同模型的泛化(推广)能力,寻求所谓的“偏差-方差”均衡,其设置目的和评价原则原文其实已写的很清楚。
3. 基于上述“2”的原则和Table-4的结果汇总,作者最终选择了“ANN with 10 hidden neurons at 15 000 training cycles”Model(因为ERR%最小,即泛化能力最好),并在Table-1进行了结果呈现