python机器学习(1)，科学技术协会面试问题_展会类机器学习 py

作者：酷酷是懒虫 | 2024-08-13 03:55:47

踩

展会类机器学习 py

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上Python知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip1024c （备注Python）

正文

要安装完整的栈或单个包，您可以参考这里给出的说明。

注意： Anaconda 是高推荐的，因为它可以无缝地安装和维护数据科学包。

scikit-learn

Scikit是一个用于Python的免费开源机器学习库。它提供了现成的功能来实现诸如线性回归、分类器、SVM、k-均值和神经网络等多种算法。它还有一些可直接用于训练和测试的样本数据集。

由于其速度、鲁棒性和易用性，它是许多机器学习应用程序中使用最广泛的库之一。

安装

通过 PyPI:

pip install -U scikit-learn

通过 conda:

conda install scikit-learn

scikit-learn 也随Anaconda发行（如上所述）。有关更多安装说明，请参阅此链接。

例子

本例中，我们在 Iris 数据集上训练一个简单的分类器，它与scikit-learn捆绑在一起。

数据集具有花的四个特征：萼片长度，萼片宽度，花瓣长度和花瓣宽度，并将它们分为三个花种（标签）：setosa、versicolor或virginica。标签已经被表示为数据集中的数字： 0（setosa），1（versicolor）和2（virginica）。

我们清洗Iris数据集，并将其分为独立的训练和测试集：保留最后10个数据点进行测试，剩余的进行训练。然后我们在训练集训练分类器，并对测试集进行预测。

from sklearn.datasets import load_iris

from sklearn import tree

from sklearn.metrics import accuracy_score

import numpy as np

#loading the iris dataset

iris = load_iris()

x = iris.data #array of the data

y = iris.target #array of labels (i.e answers) of each data entry

#getting label names i.e the three flower species

y_names = iris.target_names

#taking random indices to split the dataset into train and test

test_ids = np.random.permutation(len(x))

#splitting data and labels into train and test

#keeping last 10 entries for testing, rest for training

x_train = x[test_ids[:-10]]

x_test = x[test_ids[-10:]]

y_train = y[test_ids[:-10]]

y_test = y[test_ids[-10:]]

#classifying using decision tree

clf = tree.DecisionTreeClassifier()

最后

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/酷酷是懒虫/article/detail/973030

推荐阅读

相关标签