本帖最后由 核桃木瓜 于 2013-9-25 02:40 编辑
JMP Pro 11 新功能_广义回归
广义回归是一种全新的建模技术类型,十分适合创建预测性更强的模型(颇具挑战性的数据也能处理)。使用正则化回归或惩罚回归方法拟合广义线性模型。
如果您有关联性较强或比观测数据更多的预测变量,使用标准估计方法一般行不通。如果有很多关联的预测变量(通常是观测数据),使用逐步回归或其他标准方法将无法得到令人满意的结果。此类模型经常会过度拟合,并且很难推广到新数据。但是建模之前如何确定剔除哪些变量,或更糟的是,建模准备过程中手动预处理数据集会耗费多少时间?
JMP Pro 的广义回归能够针对杂乱的大型数据集创建预测模型。这是分析工具箱的一项重要附加功能,可用于对大量预测变量进行变量选择或创建数据挖掘模型。广义回归能够帮助您以非常自然的方式处理说明变量中的多重共线性,通过对估计参数的较大波动施加惩罚来避免过度拟合。
广义回归特质中可用的正则化方法包括岭、套索、自适应套索、弹性网络和自适应弹性网络,可帮助您更好地确定具有说明效用的 X 变量。这些方法用起来与“拟合模型”平台中的其他任何建模特质一样简单,您可以轻松确定响应,构建模型效应,并选择所需估计和验证方法。JMP 可自动拟合您的数据,在合适时选择变量,并创建可推广到新数据的预测模型。
广义回归特质使您可以为建模的响应选择合适的分布。除标准的正态或二项分布外,您还可以选择其他选项:
- Poisson – 如果您需要对计数分布进行建模。
- 零膨胀 Poisson – 如果您的计数数据的零值超过预期。
- 负二项式 – 适用于过度分散的二项分布。
- 零膨胀负二项式 – 适用于存在两个过度分散数据源的情况,其中一个的非零计数具有固有的变异性,另一个为零值超过预期的计数数据。
- Gamma – 如果您有正值整数结果,且需要估计当前偏斜度。
通过使用广义回归中的岭,您可以轻松创建模型预测的组合模型。只需将预测列用作输入数据,并将响应当作 Y 变量。使用这一强大的策略,可创建具有更高预测功效的集结模型,同时最小化预测变量中的多重共线性效应。
使用 JMP Pro 中的广义回归,您可以创建预测性更强的模型(颇具挑战性的数据也能处理)。
|