本帖最后由 shenweis 于 2014-4-30 11:50 编辑
JMP“失拟合”表给出了一个特殊的诊断检验,并且只有在数据和模型适宜时才出现。其原理为有时可以在不管模型形式是否正确的情况下估计误差方差。如果观测值对于变量 X 而言彼此完全重复,就会出现这种情况。可将这些完全重复值测量的误差称为纯误差。不管模型使用的是什么样的 X 变量形式,都无法解释或预测的样本误差的全部。但是,如果自由度很少,即很少重复的 x 值,则失拟合检验可能用处不大。 模型残差和纯误差之间的差称为失拟合误差。如果某些回归量的函数形式错误,或方差分析模型中交互作用效应太少,失拟合误差可显著大于纯误差。这种情况下,应考虑添加交互作用项(如果需要),或尝试较好地获取回归量的函数形式。 没有失拟合检验的情况通常有以下两种: 相对于 X 数据没有完全重复点,因此纯误差没有自由度。 模型达到饱和,意味着该模型本身的每个不同 x 值都有一个自由度,因此失拟合没有自由度。 回归分析中安排重复试验的目的是在于弄清影响Y 的因素除X 外,是否还有不可忽视的其他因素。如果除X 的影响外,还有其他未控制的,不可忽视的影响因素掺杂(包括交互作用),则此回归方程的拟合效果不能算是好的,称为失拟。此时,即使假设检验的结果是“回归方程有显著性”,仅能说明X对Y 有影响,并不能表明拟合的很好。因此,对于包含重复试验数据的资料,则可以通过对期望函数进行失拟检验来实现。 失拟检验的目的是确认当前的模型是否可用或很好。 判断模型好坏主要通过残差分析,而残差是由两部分组成的; 一部分是随机的,即使模型拟合得再好,它也消除不了,称为随机误差或纯误差;另一部分与模型有关,模型合适,这部分的值就小,模型不合适,这部分的值就大,称为失拟误差。 失拟检验就是以失拟误差对纯误差的相对大小来作判断的:如果失拟误差显著地大于纯误差,那么就放弃模型;如果并不显著地大于纯误差,那么就可以保留该模型。 失拟检验的P>0.05:方差分析的p<0.05,模型很好,P>0.05,模型不可用; 失拟检验的P<0.05:方差分析的p<0.05,模型可用,但不是很好,需要改进,P>0.05,模型不可用。 如有不妥,请不吝指教,谢谢! |