当前位置:   article > 正文

k-modes算法mysql_k-modes聚类算法

k-modes

为什么要用k-modes算法

k-means算法是一种简单且实用的聚类算法,但是传统的k-means算法只适用于连续属性的数据集(数值型数据),而对于离散属性的数据集,计算簇的均值以及点之间的欧式距离就变得不合适了。k-modes作为k-means的一种扩展(变种),距离使用汉明距离,适用于离散属性的数据集。

k-modes算法介绍

K-modes是数据挖掘中针对分类属性型数据进行聚类采用的方法,其算法思想比较简单,时间复杂度也比K-means、K-medoids低,大致思想如下:

假设有N个样本,M个属性且全是离散的,簇的个数为k

8fe783270378b6b27188fd733a8b49e9.png

算例

f1fc364a5f641980819cbb844a0dc632.png

de0f6b6137937c5c6665bb4108c1cc87.png

code-Python

import numpy as np

from kmodes import kmodes



声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号