设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 1563|回复: 3
打印 上一主题 下一主题

【干货】如何进行数据降维分析?

  [复制链接]
跳转到指定楼层
楼主
发表于 2017-4-6 14:38:44 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
小张是一家市场调研公司的数据分析员,初入职场的他,每天面对排山倒海的数据总是显得手忙脚乱。已是晚上9点,王老师和朋友吃完晚饭,返回办公室拿东西发现小张还在办公室一筹莫展的看着电脑,王老师便问道,“小张,怎么还在处理数据,没有下班呀!”小张苦闷的回答到,“这次的数据属性维度太多了,我不知道哪些属性重要,所以分析起来很吃力,我用了很多方法也不做不出适合的模型。”“那为何不先对数据降降维,这样就简单了。”王老师回应到。听到王老师的话,小张若有所思,再次忙碌起来。

当我们使用统计分析方法进行多变量分析的时候,变量个数太多就会增加分析的复杂性。遇到这种情况,我们一般需要采取降维的方法对变量进行降维,以期更好来进行后续的分析工作。因子分析和主成分分析就是我们常用的二种变量降维的方法,但哪种方法更好呢,接下来,我们就对这两种方法来进行比较,希望大家能从相互的比较过程中,找到适合自己分析的降维方法。

首先,我们先来给大家简单的介绍下这两种方法的原理。一般而言,针对某一个响应的若干因子之间存在着一定的相关性,因子分析就是在这些变量中找出隐藏的具有代表性的因子,将相同本质的变量归入一个因子,以此来减少变量的数目。而对于主成分来说,这种相关性意味着这些变量之间存在着一定的信息重叠,主成分分析将重复的因子(相关性强的因子)删去,通过建立尽可能保持原有信息、彼此不相关的新因子来对响应进行重新的刻画。

从统计学上来看,主成分分析本质上是一种通过线性变换来进行数据集简化的技术,它是将数据从现有的坐标系统变换到一个新的坐标系统中,然后将数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。相比较主成分分析,因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子与特殊因子两部分,然后通过构造因子模型,将原始观察变量分解为公共因子因子的线性组合。

简而言之,主成分分析是将主要成分表示为原始观察变量的线性组合,而因子分析是将原始观察变量表示为新因子的线性组合。

图1:主成分分析&因子分析的维度转换

基于两个方法的原理及实施步骤,我们不难看出,由于因子分析可以更好的解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。

此外,主成分分析主要是作为一种探索性的技术,可以同聚类分析和判别分析一起使用,帮助我们更好的进行多元分析,特别是当变量很多,数据样本量少的情况,一些统计分析方法可能不能很好的进行分析,这时候可以使用主成分分析对变量数量进行简化。例如在进行图像识别时,通过主成分分析,我们可以用更少的维度特征对图像进行识别,从而帮助我们快速的进行图像的识别和后续的分类分析等。


图2:运用主成分分析,进行图像的降维处理

自从了解到了主成分分析和因子分析的原理及用途后,小王在以后的数据分析过程中,总能很快的完成各项分析建模工作,再多的数据都不在话下,小王再也不用担心分析报告了。

更多关于JMP使用技巧或统计分析技巧,欢迎关注JMP官方微信公众号:


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
分享到:  !connect_viewthread_share_to_qq!!connect_viewthread_share_to_qq! QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 支持支持 反对反对
回复

使用道具 举报

沙发
发表于 2017-4-7 18:10:35 | 只看该作者
受教了,要是能来个案例就更好了
回复 支持 反对

使用道具 举报

板凳
发表于 2017-7-5 09:43:19 | 只看该作者
感谢 分享 昨天刚刚看了 一个例子 加深的体会
回复 支持 反对

使用道具 举报

地板
发表于 2017-8-17 15:28:10 | 只看该作者
学习标记下
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603号-2 )  

GMT+8, 2024-4-19 14:20 , Processed in 0.405855 second(s), 20 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表