赞
踩
为什么要用k-modes算法
k-means算法是一种简单且实用的聚类算法,但是传统的k-means算法只适用于连续属性的数据集(数值型数据),而对于离散属性的数据集,计算簇的均值以及点之间的欧式距离就变得不合适了。k-modes作为k-means的一种扩展(变种),距离使用汉明距离,适用于离散属性的数据集。
k-modes算法介绍
K-modes是数据挖掘中针对分类属性型数据进行聚类采用的方法,其算法思想比较简单,时间复杂度也比K-means、K-medoids低,大致思想如下:
假设有N个样本,M个属性且全是离散的,簇的个数为k
算例
code-Python
import numpy as np
from kmodes import kmodes
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。