赞
踩
在找实习期间需要认真从头学习机器学习和深度学习的相关知识,看到各种博客和github上的资料,受益良多,但是感觉机器学习各类知识千头万绪,又隐隐之中含有各种联系,仿佛之中有一条线,引导着我向里靠近,特此在这里为自己做一些总结,也希望浅见可以对其他同行有些许帮助,当然本人入行较晚,能力有限也真挚期望路过的同行能够就此中的不足给出指点,能在评论区与我讨论。
人类是对事物充满好奇也许还有些许恐惧的,恰巧世界上的事物发生发展是有一定规律的,这些规律中有的规律亘古不变,并且简单直接,如万有引力定律,力的三定律等规律,借助这些规律人们可以对一些将要发生的事物的结果进行预测,从而掌控它们趋利避害,也因此在这个复杂而又残酷的世界里占领了食物链的顶峰,这类问题中,比如小球从高空中下落,如若无外力阻挠,下落时间就是确定的,此类的问题的预测方法被称之为rule-based approach,即确定规律的方法。但这类情况在千变万化的世界中不足万一,人类也不满足于仅仅控制和使用这些基本而又简单的规律,在不同的环境和领域里试图发现和掌握更加复杂但带来更多的利益的规律。但人类发现这些问题如房价预测,如偏好揣摩好似没有规律,或者通过原来大家掌握的数学方法而总结得到的规律会十分复杂,这种复杂的规律是不符合自然规律简单美的,同时在很多场合会出现失误,这种种困难,都使得一度高傲的人类难以自处,终于,上帝为我们打开了一扇窗,去从根源处找吧。
人们发现,有些人投资房产,十投九中,预测涨跌无往不利;而我们自己可以很容易的辨别千百种物体,这些事情能够发生的原因都指向两个字——经验,而经验是不断积累而来的,如何积累,‘’我不知道未来会怎么样,但大概率是会像它曾经最多发生过的样子去发生吧,所以事物的未来好似就存在于它的过去‘’,经验的积累是对过去已发生的情况的总结。这些发生的情况,是一条条数据,通过这些数据,聪明的人类嗅到有用的信息,借助这些信息,形成自己的知识,知识是有力量的,掌握它,可以做出较为准确的判断,一次次的成功让我们拥有智慧,这就是一个智人的诞生。
那么机器学习的目的就是希望对于特定的任务(T),给机器无数的信息数据或经验(E),让他能够在当中找到一些规律提升处理任务的能力(P),如果可以提高,就认为机器拥有了智慧,得到了学习(L)。这些能够被机器完成的任务其实很有限,他们都可以抽象为一个黑匣子,给定一些输入,会产生一些输出,其中根据输入产生输出的规律就看作是一个隐性的函数,学习的本质就是找到这个函数,机器学习就是找到某个任务中最符合经验的函数,这是一个找的最优的问题。
要想让大家去赚钱,得让大家明白钱的好处,同理,要让机器具备智能,得说明发生什么就表明它具备智能了——我们前文提及机器学习是拟合一个最好的函数,计算机在学习中会为了找到这个信仰(最优函数)还没找到时,他会先根据目前掌握的知识产生一些反馈,也是一个函数我们就称之为模型(最开始也会随机的产生一些参数组成一个模型,模型初始化),同时最优函数我们人类是知道的,为了让机器知道他目前学到了什么程度,我们会把他这个模型与最优函数之间的差距告诉它,这个差距在不同任务中会以各种不同的衡量方式表明,这也是一个函数或叫目标函数或称之为一个损失。那么,接着降低损失就相当于优化模型,降低损失是需要方法的,不同的问题有不同的方法,这也是一个比较深刻的问题,当然这个过程就是教育和训练机器。
机器学习算法的本质就是去找一个问题的最优解,当然没有一器破万法存在,每一个算法能解决的问题是明确和有限的。对一个算法而言,首先要明白他能解决什么问题?(分类or回归,或者这种大任务中的哪个部分),搞清楚它的输入输出。之后,按照是否能够和如何初始化参数,建立模型,计算损失,降低损失,提高泛化能力的顺序去解剖这个算法,(其中很多算法在某个环节用的东西都是一样的)。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。