赞
踩
聚类算法是机器学习中涉及对数据进行分组的一种算法。在给定的数据集中,我们可以通过聚类算法将其分成一些不同的组。在理论上,相同的组的数据之间有相同的属性和特征,不同组数据之间的属性或者特征相差就会比较大。
算法思想
K-means算法的思想比较简单,假设我们要把数据分成K个类
代价函数
要是k-means最后的分类结果最好,也就是要是K-均值最小化,是要最小化所有的数据点与其所关联的聚类中心点之间的距离之和,因此我们可以设计K-均值的代价函数
其中
优点
缺点
改进
Mean-shift聚类是一个基于滑窗的算法,尝试找到数据点密集的区域。它是一个基于质心的算法,也就是说它的目标是通过更新中心点候选者定位每个组或类的中心点,将中心点候选者更新为滑窗内点的均值。这些候选滑窗之后会在后处理阶段被过滤,来减少邻近的重复点,最后形成了中心点的集合和它们对应的组
算法流程
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。