当前位置:   article > 正文

python机器学习(1),科学技术协会面试问题_展会类机器学习 py

展会类机器学习 py

先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7

深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年最新Python全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
img
img



既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上Python知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以添加V获取:vip1024c (备注Python)
img

正文

要安装完整的栈或单个包,您可以参考 这里 给出的说明。

注意: Anaconda 是高推荐的, 因为它可以无缝地安装和维护数据科学包。

scikit-learn


Scikit是一个用于Python的免费开源机器学习库。 它提供了现成的功能来实现诸如线性回归、 分类器、SVM、k-均值和神经网络等多种算法。它还有一些可直接用于训练和测试的样本数据集。

由于其速度、鲁棒性和易用性,它是许多机器学习应用程序中使用最广泛的库之一。

安装

通过 PyPI:

pip install -U scikit-learn

通过 conda:

conda install scikit-learn

scikit-learn 也随Anaconda发行(如上所述)。 有关更多安装说明,请参阅 此链接 。

例子

本例中,我们在 Iris 数据集 上训练一个简单的分类器,它与scikit-learn捆绑在一起。

数据集具有花的四个特征:萼片长度,萼片宽度,花瓣长度和花瓣宽度,并将它们分为三个花种 (标签):setosa、versicolor或virginica。 标签已经被表示为数据集中的数字: 0(setosa),1(versicolor)和2(virginica)。

我们清洗Iris数据集,并将其分为独立的训练和测试集:保留最后10个数据点进行测试, 剩余的进行训练。然后我们在训练集训练分类器,并对测试集进行预测。

from sklearn.datasets import load_iris

from sklearn import tree

from sklearn.metrics import accuracy_score

import numpy as np

#loading the iris dataset

iris = load_iris()

x = iris.data #array of the data

y = iris.target #array of labels (i.e answers) of each data entry

#getting label names i.e the three flower species

y_names = iris.target_names

#taking random indices to split the dataset into train and test

test_ids = np.random.permutation(len(x))

#splitting data and labels into train and test

#keeping last 10 entries for testing, rest for training

x_train = x[test_ids[:-10]]

x_test = x[test_ids[-10:]]

y_train = y[test_ids[:-10]]

y_test = y[test_ids[-10:]]

#classifying using decision tree

clf = tree.DecisionTreeClassifier()

最后

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/酷酷是懒虫/article/detail/973030
推荐阅读
相关标签