赞
踩
关于深度学习的综述有一篇较为经典的2015年综述Deep Learning in Neural Networks - An Overview,这篇从技术本身层面或者说从神经网络本身出发对深度学习做了概要。而在最近2019年的综述A Survey of Deep Learning and Its Applications - A New Paradigm to Machine Learning中,出于今年深度学习的热潮,该篇综述更多地从宏观应用层面介绍了深度学习目前的研究现状与挑战,笔者纵览其文,在此加以个人的理解转述之。
深度学习(以下简称DL)其实可以说是传统机器学习(以下简称ML)的一种纵向延伸,它的学习过程同样包含训练和测试两个阶段,即文中的training phase (includes labeling of large amounts of data and determin- ing their matching characteristics )和 inferring phase(deals with making conclusions and label new unexposed data using their previous knowledge)。但不同的是,经典的ML是需要人为的设计特征或者进行特征提取,然后再进行学习分类任务,而DL是能够自动地学习或者提取特征并进行分类任务,这就完成了一个所谓end-to-end的过程,经典ML与DL在进行任务处理的区别如下:
这里提到了自动学习提取特征就顺便需要提到表示学习(representation learning),表示学习的定性理解可以参考本人博客表示学习(representation learning)的初印象。而在该篇综述中表示学习理解如下:
Representational learning includes the set of methods that helps the machine to take the raw data as input and determines the representations for the detection and classification purpose
而DL的理解则是:
Deep learning techniques are purely such kind of learning methods that have multiple levels of representation and at more abstract level
简单理解就是表示学习是用于确定需要或者重要的特征即representations,而DL则是拥有多层representations的经典机器学习,DL的多层representation可以从表示学习那里得到(本人的理解)。这种mutli-layers的representations就包含了用于特征提取的许多非线性单元,在deep learning with python一书中也提到DL与ML的不同就是以一种新的更高级的(hierarchical)的方式去表示representations,这也是其deep的地方,所以DL有时候又叫deep structured learning或者hierarchical learning。因此综述中也总结了DL方法中的两个关键因素:
常见的基本架构包括以下几种:
高级架构简单陈列如下,如需要更多的了解可以针对每个架构拓展。
由包括三巨头之一Geoffrey Hinton在内的研究团队开发
即VGG
比VGG快,有22层而VGG19层
兼容性好:The main benefit of ResNet is that many residual layers are capable of forming a trained network
基于ResNet但更好的新架构
It depends upon designing a bounding box over the objects in the image and identifies the object given in the image
在低带宽下该架构是最有力的。
该架构最适合处理 图像分割问题(the image segmentation problems)。
这是一种比较独特的网络架构,也是近几年比较流行的一点
关于DL的特点原综述陈列了很多点,总结如下:
深度学习起于手写数字识别,而CNN已经在这方面取得了巨大成功。以下是使用DL的一些动机:
愿综述列出了很多点,主要有:
这里的传统学习(Conventional Learning)应该就是泛指比如经典ML的一类方法,其区别体现在以下几个方面:
跟上文提到的一样,DL能够从原始数据中学习出易于分类识别的特征,而传统学习需要人为设计特征
既然能够自行学习特征,那么DL的泛化性显然更高
还是因为能够自行学习特征,因此在准备数据方面DL不需要太过繁琐甚至就是不需要。
为了防止过拟合,DL需要更多的数据,相应地执行时间会很长,通常需要GPU加速。
DL的应用十分广泛,如下图:
以下将逐条简介,更多细节比如研究过程和原理还需要参考原综述以及其他资料。
首先是图像处理方面,
这是近几年以及未来的一个重点方面
合成孔径雷达可以参考百科,因其较强的地表穿透能力,可用于灾害监测、环境监测、海洋监测等方面,与DL的结合将能更好地提高识别能力
遥感参考百度百科,即对远距离目标所辐射和反射的电磁波信息,进行收集、处理,并最后成像
Person re-identification is the task of associating images of the same person taken from different cameras or from the same camera in different occasions。即识别不同相机下或者不同场景相同相机下的同一个人,可以用于智能监视系统。
比如穿戴机器人常碰到的步态识别
即自动驾驶的泊车方面,主要使用图像处理
即植物分类
以下是语音、语义以及文本等方面
包含语义识别(speech recognition)等方面
包含不同国家语言甚至方言等
即识别不同的写作风格,或者说写出多种风格的文字
又叫keyword spotting,比如找到扫描图像中的所有查询词
比如分离出语音信号的噪声等
以下是其他的方面
暂不分析
这是前几年比较火的一个方向
即类似于统计学预测股票的涨跌
暂时不作分析
包含很多方面,例如医学成像,图像识别、理解、分割与融合(image fusion),计算机辅助诊断,可用于医疗保健、生物影像分类(Biological Image Classification)等
即在移动终端上使用深度学习引擎
比如使用自编码器增加通信的准确性与稳定性
这是一个比较综合的应用,包含物体检测、人脸检测各个方面
比如情绪分析(the sentiment analysis)等
尽管DL方法非常好且精确,但是仍然有一些挑战或者说缺点需要克服,如下:
总结来看,首先需要注意作为DL的两个关键元素hierarchy of layers和 the supervision in learning。此外需要记住DL像是ML的一个延伸,即深度学习依赖于机器学习中现有算法(对应 the supervision in learning)的优化及其在多层次处理方面(对应hierarchy of layers)的创新。然后就是深度学习应用的领域将会很广,比较热门的有数字图像处理和语音识别(speech recognition)等方面的应用。最后,DL这门科学才刚刚起步,未来几年将会在越来越多的方面,比如NLP、遥感和医疗保健,迎来大爆发。
DL未来的展望主要包括:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。