数据挖掘中K-Means算法是如何工作的?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1455个文字,预计阅读时间需要6分钟。
一篇文章推荐多分享一些具体算法相关的内容,本期分享一下数据挖掘相关的算法。简介:K均值算法,又称K均值聚类算法,是非监督学习中的一种聚类算法。基本思想+K-means算法比较简单。在K-means算法中,‘‘
一位读者建议多分享一些具体算法相关的内容,这期分享一下数据挖掘相关的算法。
简介
又叫K-均值算法,是非监督学习中的聚类算法。
基本思想
k-means算法比较简单。在k-means算法中,用cluster来表示簇;容易证明k-means算法收敛等同于所有质心不再发生变化。基本的k-means算法流程如下:
选取k个初始质心(作为初始cluster,每个初始cluster只包含一个点);
repeat:
对每个样本点,计算得到距其最近的质心,将其类别标为该质心所对应的cluster;
重新计算k个cluster对应的质心(质心是cluster中样本点的均值);
until 质心不再发生变化
repeat的次数决定了算法的迭代次数。
本文共计1455个文字,预计阅读时间需要6分钟。
一篇文章推荐多分享一些具体算法相关的内容,本期分享一下数据挖掘相关的算法。简介:K均值算法,又称K均值聚类算法,是非监督学习中的一种聚类算法。基本思想+K-means算法比较简单。在K-means算法中,‘‘
一位读者建议多分享一些具体算法相关的内容,这期分享一下数据挖掘相关的算法。
简介
又叫K-均值算法,是非监督学习中的聚类算法。
基本思想
k-means算法比较简单。在k-means算法中,用cluster来表示簇;容易证明k-means算法收敛等同于所有质心不再发生变化。基本的k-means算法流程如下:
选取k个初始质心(作为初始cluster,每个初始cluster只包含一个点);
repeat:
对每个样本点,计算得到距其最近的质心,将其类别标为该质心所对应的cluster;
重新计算k个cluster对应的质心(质心是cluster中样本点的均值);
until 质心不再发生变化
repeat的次数决定了算法的迭代次数。

