当前位置:   article > 正文

机器学习(浙大胡浩基)_机器学习胡浩基

机器学习胡浩基

定义

Arthur Samuel:机器学习是这样的领域,它赋予计算机学习的能力,这种学习能力不是通过显著式编程来获得的。
显著式编程:人为设定规律的编程方法(定死了输入和输出)。
非显著式编程:让计算机自己总结规律的编程方法。

Tom Mitshell:一个计算机程序被称为可以学习,是指它能够针对某个任务T和某个性能指标P,从经验M中学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着经验E的增加而提高。

举个例子:识别菊花和玫瑰
任务T:识别菊花和玫瑰花。
经验E:一些菊花和玫瑰花的图片,也叫做训练样本。
性能指标P:识别率,即识别的正确率。

四个任务:
1.下棋
2.垃圾邮件识别
3.人脸识别
4.无人驾驶

分类

按照任务是否和环境产生交互可以分为监督学习和强化学习。

一、监督学习:输入计算机训练数据同时加上标签的机器学习

1.首先是按照驯良数据是否有标签分为三类

  • 传统的监督学习:每一个训练数据都有对应的标签
    • 支持向量机
    • 人工神经网络
    • 深度神经网络
  • 非监督学习:所有训练数据都没有对应的标签
    • 聚类
    • EM算法
    • 主成分分析
  • 半监督学习:训练数据中一部分有标签,一部分没有标签

2.还可以按照标签连续与离散,将监督学习分为分类问题和回归问题两种。

二、强化学习:计算机通过与环境的互动强化自己的行为模式

算法过程

机器学习的重点,不是研究如何提取特征,而是在假设已经提取好特征的前提下,如何设计更好的算法来提高学习系统的性能。

没有免费午餐定理:任何一个预测函数,如果在一些训练样本上表现好,那么必然在一些训练样本上表现不好。如果不对数据在特征空间的先验分布上有一定的假设,那么表现好与表现不好的情况一样多(即没有任何情况下都最好的机器学习算法)。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/767874
推荐阅读
相关标签
  

闽ICP备14008679号