设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 2313|回复: 3
打印 上一主题 下一主题

2020 全球幸福指数地图:哪些地区的人幸福感最强?

  [复制链接]
跳转到指定楼层
楼主
发表于 2020-10-22 15:58:29 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
“如果有一个从0分到10分的阶梯,顶层的10分代表你可能得到的最幸福的生活,底层的0分代表你可能得到的最差的生活。你觉得自己现在在哪一层呢?”

你可能要问:什么是最幸福的生活?

可能是拥有财富的满足,可能是成功带来的喜悦,可能是付出后的回报,可能是收获时的自豪,可能是淡泊时的高洁。幸福的生活似乎从来都没有一个固定的答案。

但联合国发布的《全球幸福指数报告》告诉我们,幸福其实也是可以量化的。这份报告根据国民幸福感不同观点的数据进行分析,综合评定幸福指数,并以此进行排名,其中主要的因素包括人均国内生产总值(GDP)、健康预期寿命、生活水平、国民内心幸福感、人生抉择自由、社会清廉程度以及慷慨程度等,总计33个分项。

今天,我们就根据盖洛普全球幸福报告专题(https://worldhappiness.report/ed/2020) 网站上的公开数据,结合JMP软件来看看哪些国家在全球幸福报告上排名比较高,以及哪些因素对幸福指数的影响比较大。


01 从数据导入和整理开始
首先,调取盖洛普全球幸福报告专题页面(https://worldhappiness.report/ed/2020/)的原始数据,稍加整理将2015-2020年的Excel 文件保存到一个文件夹下。

其次,将所有Excel文件一次导入JMP并整合成一张数据表,除了完全保留原数据表中的数据列,JMP还会自动产生文件名列,方便查看数据来源。
(👉 JMP操作:文件->导入多个文件)

提取指定列的部分所需内容,快速生成年份信息列。
(👉 JMP操作:列->重新编码)

整理完数据,我们就可以借助JMP来自由地探索数据了。

02 数据的可视化探索性分析

JMP图形生成器是全面探索数据的好帮手,它可以让你清晰地查看你所研究数据的基本分布、对比、趋势走向等信息。

2020年被调查的各个区域的平均幸福感得分
通过JMP图形生成器简单画图后,我们可以看到下图的分布报告。

报告将全球国家和区域分成10个大的区域,其中,撒哈拉以南非洲的国家和地区最多,达到39个,同时也是平均幸福感最低的区域。北美和澳洲区是平均幸福感得分最高的区域,不过只有4个国家和地区。
(👉 JMP操作:画图->图形生成器->并排条形图,浮动条形图)
<br/>2020年排名前10的国家在之前几年的表现
从报告中可以看到,芬兰连续3年排名第一,丹麦连续2年排名第二,瑞士在连续几年排名下滑的情况下,今年升到第三名。卢森堡从2016年开始,连续几年排名上升,首次进入前10。
(&#128073; JMP操作:画图->图形生成器->线图)


2020年全球幸福指数地图
一图胜千言!2020年全球幸福指数地图整体来看,北欧国家的幸福指数最高,如芬兰、丹麦、冰岛、挪威;非洲尤其是中非和东非的国家幸福指数较低,亚洲的阿富汗和印度幸福指数也比较低。
(&#128073; JMP操作:画图->图形生成器->地图功能,及数据过滤器)

幸福感得分到底和哪些指标关系更大呢?难道只是财富GDP吗?
从下面JMP生成的多元图可以清晰地看到,与幸福感得分的相关性依次为:GDP > 健康预期寿命 > 社会帮助 > 人生自由选择 > 社会清廉程度 > 慷慨程度,因此我们可以理解为财富和健康在人们看来都是非常重要的幸福指标。
(&#128073; JMP操作:分析->多元方法->多元)

以上是一些探索性数据分析的结果,下面我们来进一步尝试用上面提到的主要参数与幸福感得分建立量化的统计模型。


03 数据预测建模

线性模型之尝试
应用JMP的拟合模型平台,将幸福感得分作为响应, 其他6列信息作为因素尝试生成线性模型,来查看模型的预测值和真实值。

通过生成的散点图以及R平方(0.76)来看,拟合效果似乎很不错。通过效应汇总表可知,模型变量重要性依次为:GDP,人生自由选择,社会帮助,健康预期寿命,社会清廉程度和慷慨程度。

看到这里你可能会产生疑问:之前做相关性分析的时候,明明“健康预期寿命”和“社会帮助”两项比“人生自由选择”与幸福感得分的相关性更强,为什么到预测模型这里结果却变了呢?这是因为预测模型这里其实存在潜在因素共线性的问题,这对因素重要性的判断及预测误差都可能有影响。

为了更客观地查看影响因子,优化模型,我们尝试利用主成分分析来进一步探索。这里主成分分析的意义在于对原有重复的变量删去多余,建立尽可能少的新变量,使得这些新变量不但两两不相关,而且在反映信息方面尽可能保持原有的信息。


线性模型之优化
从下图的分析结果可以确认“GDP”,“健康预期寿命”和“社会帮助”确实与幸福感存在强相关,新生成的4个主成分数据列能解释之前6个因素90%以上的信息,从而在实现数据降维的同时,也减少共线性对线性模型的影响。

重新以幸福感得分作为响应,新生成的4个主成分数据列作为因素生成线性模型,同时对幸福度得分7.8时做预测。

从下图可以看到,新模型的95%置信区间为[7.62454,7.97546]要小于原模型预测值的置信区间[7.61752,7.9834],当然因为响应的区间是[2.51-7.81]的原因,所以似乎改善效果不明显,可是如果响应的区间是千级、万级呢?


数据挖掘方法之尝试
JMP提供了诸如神经网络、决策树、随机森林、提升树和支持向量机等多种数据挖掘的方法(部分功能仅在JMP Pro中有),并且可以轻松实现模型之间的比较。

仅以最简单的单层3节点神经网络预测模型为例,验证集的预测R平方就能达到0.77,稍微增加节点数到10,并结合提升功能,能使R平方提升到0.83,这意味着该模型能对幸福度得分做出更好的预测。

通过JMP的可视化分析、数据探索、建模与数据挖掘后,我们的分析报告也就新鲜出炉了。

那么,如何在JMPer学习圈或者行业内秀一波分析结果呢?这也不是什么难题!


04 数据共享

你可以把可视化的图形报告可以发布到JMP Public/ JMP Live 轻松实现结果公开共享或者特定人群内部分享
全球幸福指数地图分享链接:
https://public.jmp.com/packages/World-Happiness-Report/js-p/PGGdhKqZWQy6Btpf05Nn8

你也可以试试看看:


分享到:  !connect_viewthread_share_to_qq!!connect_viewthread_share_to_qq! QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 支持支持1 反对反对
回复

使用道具 举报

沙发
发表于 2020-11-1 20:43:32 | 只看该作者
两处思路
全局思路1:这份报告的价值与内涵(任意一款软件,都可以实现部分/全部)---->再来对比JMP的优势所在
局部思路1:展示JMP
期待能看到上面的思路案例,真的“幸福”^V^
回复 支持 反对

使用道具 举报

板凳
发表于 2022-4-21 07:35:17 | 只看该作者
全局思路看问题,很好
回复 支持 反对

使用道具 举报

地板
发表于 2022-5-31 07:30:22 | 只看该作者
很好的分享资料
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-4-20 12:56 , Processed in 0.382200 second(s), 15 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表