当前位置:   article > 正文

机器学习(一)

机器学习(一)

经典定义:

利用经验改善系统自身的性能。

经典的机器学习过程:

基本术语:

数据集:训练集、测试集

示例、样例、样本

属性、特征:属性值

属性空间、样本空间、输入空间

特征向量

标记空间、输出空间

归纳偏好(偏置):

任何一个有效的机器学习算法必有其偏好

学习算法的归纳偏好是否与问题本身匹配,大多数直接决定了算法能否取得好的性能

泛化能力:对新的未见过的处理能力强。

一、到底要什么

二、给的是不是想要的

泛化误差:在“未来”样本上的误差

经验误差:在训练集上的误差,亦称“训练误差”

过拟合 VS 欠拟合

三大问题:

一、如何获得测试结果 (评估方法)

关键:怎么获得“测试集

测试集应该与训练接“互斥”

常见方法有:留出法、交叉验证法、自助法

k-折交叉验证法

调参与最终模型:

算法的参数:一般由人工设定,亦称“超参数”

模型的参数:一般由学习确定

调参本身就是一种对模型的选择,

二、如何评估性能优劣 (性能度量)

性能度量是衡量模型泛化能力的评价标准,反映了任务需求。

错误率、精度、查准率、查全率、F1度量

三、如何判断实质差别 (比较检验)

统计解设检验为学习器性能比较提供了重要依据。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/320845
推荐阅读
相关标签
  

闽ICP备14008679号