赞
踩
机器学习(Machine learning,ML)已经成为当今的热门话题,但是从机器学习概念的诞生到机器学习技术得以普遍应用经历了一段漫长的过程。最早给出机器学习概念的诞生到机器学习技术得以普遍应用经历了一段漫长的过程。最早给出机器学习的概念是“机器学习是在不直接针对问题进行编程的情况下,赋予计算机一个研究领域”计算机系Tom Mitchell赋予机器学习一个更被人们广泛接受的定义:假设用p评估计算机程序在某任务类T上的性能,若一个程序利用经验E在T中任务上获得了性能改善,则认为关于T和P,改程序对E进行了学习。以计算机下围棋程序为例,经验E就是通过学习现有的高水平围棋棋谱,再加上程序成千上万次的自我对弈后积累形成的下棋策略;任务T就是下围棋;性能度量值P就是它在与对手进行围棋比赛时获胜的概率。
随着对机器学习了解的深入,机器学习的内涵和外延也在不断发生变化。目前普遍认为,机器学习专门研究计算机如何模拟或实现人类的学习行为,以获得新的知识或技能,重新组织已有的知识结构使之不断完善系统和自身的性能;他是人工智能的核心,是使计算机具有智能的根本途径。机器学习是一门多领域交叉学科,涉及计算机科学、概率论、统计学、最优化理论、控制论、信息论、决策论、认知科学等多个领域。
在计算机系统中,经验通常是以数据结构形式存在的,因此机器学习研究的主要内容是使计算机如何从已有的数据中产生模型的算法(也就是学习方法),以便利用基于经验数据得到的模型(这里的“模型”泛指从数据中学到得到的结果)对新的情况做出判断或者预判。由此可见,要进行机器学习,首先要有数据(data)。假设要对某个商品楼盘的售价情况进行预测分析,如果搜集了不同特性的楼盘和所对应的价格信息,包括房屋的面积、户型、楼层、地理位置、物业、开发商、周边配套等,这组记录的集合就称为一个数据集(data set);其中每条记录是关于一个事件或对象的描述,称为示例(instance)或样本 sample。反映事件或者对象在某方面的表现或者性质的事项,称为属性attribute或特征feature;属性的取值称为属性值;属性所张成的空间称为属性空间attribute space、样本空间sample space或输出空间。利用学习算法从数据中学得模型的过程称为训练数据,其中每个样本称为一个训练样本,其组成的集合称为训练集training set。
机器学习的目标是使学到的模型能很好的适用于新样本,而不仅仅是训练集。模型适用于新样本的能力称为泛化能力。通常假设样本空间中的全部样本服从一个未知分布,每个样本均从这个分布中独立获得,即独立同分布(independent and identically distributed,i.i.d)。一般而言,训练样本越多,越有可能通过学习获得具有较强泛化能力的模型。
Rosenblatt算法: (484条消息) 初探神经网络(二)单层感知机的Rosenblatt算法原理_Yooooung_Lee的博客-CSDN博客CNN与生物视觉系统的研究探索:卷积神经网络十五问:CNN与生物视觉系统的研究探索 - 知乎 (zhihu.com)
感知机(Perceptron):算法理论03 感知机(Perceptron) - 知乎 (zhihu.com)
ID3算法:决策树算法--ID3算法 - 知乎 (zhihu.com)
BP算法:神经网络,BP算法的理解与推导 - 知乎 (zhihu.com)
向量机支持向量机(SVM)——原理篇 - 知乎 (zhihu.com)
-Adaboost算法AdaBoost算法 - 知乎 (zhihu.com)
Random forest随机森林 - Random Forest - 知乎 (zhihu.com)
NN算法:神经网络NN算法(理论篇) - 知乎 (zhihu.com)
机器学习发展史等一些学习方法的总结
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。