赞
踩
通过前一节对循环神经网络RNN的了解,简单的RNN虽然能够解决长期依赖问题,但是训练和优化比较困难,然后长短时记忆模型LSTM很大程度上解决长期依赖问题,本文主要介绍
1.LSTM的提出
2.LSTM网络结构
3.LSTM的分析
早在94年Hochreiter发现了RNN训练过程中的梯度消失和爆炸问题,然后在99年提出LSTM解决该问题。
梯度消失问题的原因可以参考之前的介绍。
RNN难训练的主要原因在后向传播过程中,梯度随着时间序列的增加而逐渐消失。如果误差能够不消减的进行传递,则可以避免训练难得问题。
假设隐藏层只有一个节点j,则该节点误差计算过程为
LSTM也是根据CEC演化而来。
针对上面的必要条件
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。