当前位置:   article > 正文

金融业信贷风控算法9-聚类场景之K均值聚类与K邻近聚类_kmeans 金融实例 csdn

kmeans 金融实例 csdn

一. K均值聚类:物以类聚、人以群分

聚类算法是数据挖掘中的一项重要技术,其目的是使聚类后同一类的数据尽可能聚集在一起,不同的数据尽可能分离。聚类模型既有有监督的场景又有无监督的场景。经过一定的改造,还可以适用于半监督的场景。

常见的非监督式的聚类模型有:

  1. 原型聚类:原型聚类是指聚类结构能通过一组原型刻画。原型是指样本空间中具有代表性的点。通常情况下,算法先对原型进行初始化,然后对原型进行迭代更新求解。常见的算法有k-均值聚类、学习向量量化、高斯混合聚类
  2. 密度聚类:从样本的分布密度出发考虑样本间的可连接性,并基于可连接性样本不断扩展聚类簇以获得最终的聚类结果。常见的算法有DBSCAN
  3. 层次聚类:在不同层次对数据集进行划分,从而形成树型的聚类结构。常见的算法有AGNES

1.1 距离的概念

在聚类模型中,刻画样本间的“距离”是非常重要、也是最本质的内容。距离

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/371904
推荐阅读
相关标签