当前位置:   article > 正文

机器学习算法笔记之K近邻算法(KNeighborsClassifier)_sklearn kneighborsclassifier

sklearn kneighborsclassifier

介绍:

在sklearn库中,KNeighborsClassifier是实现K近邻算法的一个类,一般都使用欧式距离进行测量。

这个类的结构如下:

sklearn.neighbors.KNeighborsClassifier

class  sklearn.neighbors. KNeighborsClassifier ( n_neighbors=5weights=’uniform’algorithm=’auto’leaf_size=30, p=2metric=’minkowski’metric_params=Nonen_jobs=1**kwargs )

在官方文档中,每个参数的含义:



n_neighbors:就是选取最近的点的个数:k

leaf_size:这个是构造树的大小,值一般选取默认值即可,太大会影响速度。

n_jobs :默认值1,选取-1占据CPU比重会减小,但运行速度也会变慢,所有的core都会运行。

这个类中的方法,在文档中的说明:


小试牛刀:

导库:

  
  
  1. import numpy
  2. from sklearn.neighbors import KNeighborsClassifier as kNN
  • 1
构造训练集和对应的标签:

  
  
  1. trainmat = numpy.array([[ 1, 2, 3],[ 2, 3, 5],[ 55, 33, 66],[ 55, 33, 66]])
  2. label = numpy.array([ 0, 0, 1, 1])
  • 1

实例化分类器,并训练数据:

  
  
  1. neigh = kNN(n_neighbors= 3, algorithm= 'auto', weights= 'distance', n_jobs= 1)
  2. neigh.fit(trainmat,label)
  • 1
训练完后会看到分类器的参数:

然后写一个测试数组:
testmat = numpy.array([2,3,4],[55,33,66])

  
  
  • 1
  • 2
我们使用三个最长用的方法,来看一下分类的结果:

结果很乐观,测试数组testmat中的两组值分别属于标签0和1的概率是0.99275805和1。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/703036
推荐阅读
相关标签
  

闽ICP备14008679号