凡人多烦事01

这个屌丝很懒，什么也没留下！

热门标签

机器学习入门实战-KNN完成鸢尾花分类预测_1.利用鸢尾花数据集构建一个knn分类器,能够对给定的鸢尾花样本进行分类和预测

作者：凡人多烦事01 | 2024-06-15 11:10:05

踩

1.利用鸢尾花数据集构建一个knn分类器,能够对给定的鸢尾花样本进行分类和预测

引言

本篇文章主要是为了让大家过一遍机器学习的应用流程，希望文章中的案例可以帮助大家温习机器学习的基础知识，并学习应用机器学习解决问题的基本流程。

准备环境

文章中会用到的python库：

Scikit-Learn: 最常用的机器学习算法库之一。

可以通过pip安装：

$ pip install scikit-learn

1、数据集

案例中使用的数据集是鸢尾花数据集，可自行导入

数据集包含150个样本
数据集包含4个属性：Sepal Length，Sepal Width，Petal Length，Petal Width
数据集包含3个种类：种类：Iris Setosa、Iris Versicolour，Iris Virginica

1.1、载入鸢尾花数据集

from sklearn import datasets

iris = datasets.load_iris()
X = iris.data  # 样本特征
y = iris.target  # 样本标签
1
2
3
4
5

1.2、查看数据集

X.shape
1

(150, 4)

y
1

在这里插入图片描述

1.3、划分数据集

# 将数据集拆分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=66)
1
2

其中25%为测试集

2、标准化

# 样本特征标准化
std = StandardScaler()
# 通过训练样本特征进行标准化拟合并转换
X_train_standard = std.fit_transform(X_train)
X_test_standard = std.transform(X_test)
1
2
3
4
5

3、模型训练拟合

from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train_standard, y_train)  # 拟合
1
2
3

4、预测结果

y_predict = knn.predict(X_test_standard)
print(y_predict)
1
2

在这里插入图片描述

5、预测准确率

sum(y_test == y_predict) / len(y_test)  # 方式一
print(knn.score(X_test_standard, y_test))  # 方式二
1
2

在这里插入图片描述

6、全部代码

from sklearn import datasets
from sklearn.preprocessing import StandardScaler  # 标准化
from sklearn.model_selection import train_test_split # 划分数据集
from sklearn.neighbors import KNeighborsClassifier


# 加载鸢尾花数据集
iris = datasets.load_iris()
X = iris.data  # 样本特征
y = iris.target  # 样本标签
# 将数据集拆分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=66)

# 样本特征标准化
std = StandardScaler()
# 通过训练样本特征进行标准化拟合并转换
X_train_standard = std.fit_transform(X_train)
X_test_standard = std.transform(X_test)

knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train_standard, y_train)  # 拟合
y_predict = knn.predict(X_test_standard)
print(y_predict)

print(knn.score(X_test_standard, y_test))
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

了解KNN算法请点击：机器学习-K近邻(KNN)算法详解

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：【wpsshop博客】

机器学习入门实战-KNN完成鸢尾花分类预测_1.利用鸢尾花数据集构建一个knn分类器,能够对给定的鸢尾花样本进行分类和预测

目录

引言

准备环境

1、数据集

1.1、载入鸢尾花数据集

1.2、查看数据集

1.3、划分数据集

2、标准化

3、模型训练拟合

4、预测结果

5、预测准确率

6、全部代码