设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 2053|回复: 7
打印 上一主题 下一主题

利用JMP的偏最小二乘回归分析辽宁统计年鉴2006中的数据

  [复制链接]
跳转到指定楼层
楼主
发表于 2014-4-23 16:31:33 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 shenweis 于 2014-4-23 16:59 编辑

    最近在学习典型相关分析时,将一个案例发给niksong,结果他用最小二乘法进行了分析,我这才意识到偏最小二乘法对我自己来说还是一个空白,没有什么捷径,找案例,通过JMP实现!
    结果找到2本有关偏最小二乘回归的专著,一本是《偏最小二乘回归方法及其应用》,另一本是《偏最小二乘回归的线性与非线性方法》 ,这两本书都是王惠文教授等编写,由于版权关系,尤其是百度十分容易找到,这里就不提供下载了。
    找到的另一个案例是利用辽宁统计年鉴2006的数据,采用偏最小二乘回归技术, 给经济发展提供参考,说实话,这是第一次感觉到统计分析技术的强劲力量,虽然我常对同事强调统计学的重要。
    好了,废话不多说了。
    先上数据,对各列数据都有详细说明:
   
    原作者的结论:
    由分析得到的信息:

1从因变量与自变量之间的相关系数和变量重要性图可以看出,辽宁省的教育投入对经济发展有着深刻、全面的促进作用。对三大产业经济产出促进作用最大的就是教育的财政投入,然后依次是高等、中等、研究生、初等教育程度的劳动力人数。教育投入对三大产业经济产出的边际作用结构上是相似的,财政投入对第三产业产出值的边际贡献最大。
21,国家的高校扩招政策对经济产生了积极的影响。据辽宁省教育厅日前的统计,辽宁省高等教育35.3%的毛入学率表明,辽宁省已经率先进入大众化高等教育时代,数据表明,辽宁省高校招生人数的持续增长,特别是2001年以来的快速增长,与辽宁省的经济增长是适应的,反过来说大众化的高等教育对经济的增长直接促进作用开始显现。
31,初等教育程度劳动力人数对经济产出影响最小甚至是负面的。由于义务教育的普及和辽宁省较高的中等教育普及率,文盲和新增初等教育程度的劳动力人数逐渐减少,因此该项指标对经济产出的解释能力变小。初等教育程度劳动力人数与其它各项指标的负相关性表明,中等以上教育程度劳动力人数增加的必然结果是初等教育程度劳动力人数的下降,而教育财政投入的增加是抑制初等教育程度劳动力人数的最重要因素,初等教育程度劳动力的就业对全社会经济的增长是一种负担。
41,我们认为研究生教育的规模应当适当扩大,经费投入应当增加和多样化。研究生教育程度劳动力人数对经济的影响重要性排名靠后,主要原因是研究生招生规模小、人数少,教育经费主要依赖财政投入。另外,研究生教育程度的劳动力人数对经济的影响可能要通过科技投入类指标间接的反映到经济产出上,这也表明教育投入对经济产出的影响是复杂的。
514的基础上深入分析,我们认为教育投入的强度和投入渠道的多样化对经济产出是有着重要、广泛和深远的影响。高等和中等教育程度劳动力人数对经济产出影响的重要性排名靠前,而初等和研究生教育程度劳动力人数排名靠后,这与我国目前相应的教育经费筹措渠道的不同有关。目前,我国的高等和中等教育的经费除国家的财政性投入之外,社会与个人的投入力度较大,高、中等教育程度劳动力人数的增加实质上是相应教育经费投入的增加。但初等和研究生教育的经费渠道相对单一,相应教育阶段的经费总投入相对较低是其对经济产出的解释能力较低的重要原因。
    6在模型自身方面,从变量重要性的角度,剔除解释能力较小的自变量,能够有效的提高模型的预测效果。但这一点对具体问题需要进行谨慎分析。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
分享到:  !connect_viewthread_share_to_qq!!connect_viewthread_share_to_qq! QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏1 转播转播 分享分享 分享淘帖 支持支持 反对反对
回复

使用道具 举报

沙发
 楼主| 发表于 2014-4-23 16:43:06 | 只看该作者
本帖最后由 shenweis 于 2014-4-23 16:54 编辑

多元相关:

带一个因子的结果:

删除L4后带一个因子的结果:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

板凳
 楼主| 发表于 2014-4-23 16:43:45 | 只看该作者
数据中已保存了运行脚本。你可以关注带不同因子数的模型的回归系数的正负,在“原始数据的模型系数”中看,只有取一个因子时,L4这个自变量才是负值,如果其它较高学历自变量为负值时,显然不合实际。由于L4这个因素从变量重要性图看是影响最小的,可删除重新回归分析。

请大家参与讨论。
回复 支持 反对

使用道具 举报

地板
发表于 2014-4-24 13:06:31 | 只看该作者
强大,学习。顶你楼主,
回复 支持 反对

使用道具 举报

5#
发表于 2016-6-16 16:24:59 | 只看该作者
确实是敏捷分析!
谢谢!
回复 支持 反对

使用道具 举报

6#
发表于 2016-11-17 17:09:46 | 只看该作者
学习分析,谢谢
回复 支持 反对

使用道具 举报

7#
发表于 2016-11-20 18:38:49 | 只看该作者
楼主,只带一个因子的原始数据模型系数与你的运行结果不一样,把两种反推最终表达式均不成立,请楼主指点

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

8#
发表于 2020-6-25 22:28:06 | 只看该作者
回复绿灵:
楼主用的是:分析\拟合模型,再选择偏最小二乘
绿灵用的是:分析\多元方法\偏最小二乘

二者的计算结果,除“原始数据的模型系数”外,其他结果都相同。

JMP15版中:分析\拟合模型,再选择偏最小二乘,已经找不到了。所以,我更倾向于你的计算方法。
欢迎继续讨论。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-4-24 20:38 , Processed in 0.418732 second(s), 17 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表