深度学习-RNN(比较浅)

面对序列信号(语音、视频)如何建模

无法保留时序信息;

无法建模长期依赖关系 ;

通用性差;

序列模型需要满足:
• 可处理变长输入序列
• 能够学习长期的依赖关系
• 保留序列本身的时序信息

RNN

Recurrent Neural Network(递归神经网络)

RNN结构

状态更新

误差函数对于ℎ0的梯度包含𝑊ℎℎ和非线性激活函数的多次方计算:
• 𝑊ℎℎ过大导致梯度爆炸(exploding gradient)
• 𝑊ℎℎ过小会导致梯度消失(vanishing gradient)

思路:设计更复杂的递归单元(recurrent unit/cell)来保留长期关系

LSTM解决方案

---------------- 本文结束 ----------------

本文标题:深度学习-RNN(比较浅)

文章作者:Pabebe

发布时间:2020年04月20日 - 16:18:06

最后更新:2020年06月16日 - 18:24:34

原始链接:https://pabebezz.github.io/article/c91fc4b/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

0%