赞
踩
以下内容主要来自去年编写某个工作方案期间的学习,以及近期阅读书籍和学习极客时间课程的笔记。属于扫盲的一个简单小结。本人算是半个围棋迷,AlphaGo横空出世击败当时世界围棋第一人李世石,让我首次真正关注人工智能、机器学习等内容。实际感受到其实际效用,是在去年的省级大项目咨询设计以及今年的GA的项目设计中,和TX、SG、KDXF、GXX等公司深度交流中感受到的,这玩意已经在实实在在的作为大卖点卖钱了。
机器学习是计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的学科。可说是从数据中来,到数据中去。机器学习要做的就是根据已有的训练数据推导出描述所有数据的模型,并根据得出的模型实现对未知的测试数据的最优预测。(例如:AlphaGo属于典型的机器学习,开始是利用人类棋谱进行训练。到了Zero以后,就是自己和自己拆棋,3天能写搞对抗的几十万盘,人哪能有这样的训练强度,自然被干趴下,一堆世界冠军被打倒让两子以下。这类属于规则明确而且不存在多种因素博弈的,机器学习效果立竿见影。)
根据输入输出类型的不同,预测问题可以分为以下三类。1)分类问题:输出变量为有限个离散变量,当个数为 2 时即为最简单的二分类问题;2)回归问题:输入变量和输出变量均为连续变量;3)标注问题:输入变量和输出变量均为变量序列。
重要指标: 错误率。机器学习必然存在过拟合(学习时模型包含的参数过多,从而导致训练误差较低但测试误差较高。)、欠拟合()等情况,会存在错误率。
调参,也就是对算法参数进行设定,是机器学习中重要的工程问题,在神经网络与深度学习中体现得尤为明显。
根据训练数据是否具有标签信息,可以将机器学习的任务分成以下三类。
受学习方式的影响,效果较好的学习算法执行的都是监督学习的任务。
监督学习的任务就是在假设空间中根据特定的误差准则找到最优的模型。根据学习方法的不同,监督学习可以分为生成方法与判别方法两类。两相对比,生成方法具有更快的收敛速度和更广的应用范围,判别方法则具有更高的准确率和更简单的使用方式。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。