设为首页收藏本站

JMP数据分析论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 398|回复: 1

求教,同一组数据,为什么使用JMP的K Means和sklearn的K-Means方法得到的质心不一样?

[复制链接]
发表于 2019-12-29 15:17:22 | 显示全部楼层 |阅读模式
本帖最后由 lohc710072 于 2019-12-29 15:23 编辑

我在使用JMP和Sklearn对同一组数据使用KMeans聚类时得到的质心不一致,请问是聚类的方法不一样?恳请指导,谢谢!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

发表于 2020-1-11 18:46:05 | 显示全部楼层
您好,对Sklearn没有深入研究,但就K-means的聚类结果而言,本身就具有一定不确定性,也受算法不同启动参数设置影响。

其中,导致聚类结果差异最常见的原因,无外乎是由于k-means迭代算法中初始类中心是随机产生或人为定义的,因此,如果初始类中心定义不同,聚类结果也就可能随之不同。
在JMP的K-means平台中,采用相对稳健的初始类中心生成方法以提高运算速度和结果稳定性,而未提供相应的参数设置选项,以下小视频以 Iris 经典数据集为样本,对比了原始数据集和仅变更行排序后数据集的聚类结果,来变向表征不同初始类中心的潜在影响。
K-means Cluster Demo


因此,即便Sklearn,我想如果您没有固化生成初始类中心的随机种子的话,结果可能也会略有不同。

以上,仅供参考~

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|JMP数据分析论坛 ( 沪ICP备13022603 )  

GMT+8, 2020-8-15 17:55 , Processed in 0.300030 second(s), 17 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表