面对序列信号(语音、视频)如何建模
无法保留时序信息;
无法建模长期依赖关系 ;
通用性差;
序列模型需要满足:
• 可处理变长输入序列
• 能够学习长期的依赖关系
• 保留序列本身的时序信息
RNN
Recurrent Neural Network(递归神经网络)
误差函数对于ℎ0的梯度包含𝑊ℎℎ和非线性激活函数的多次方计算:
• 𝑊ℎℎ过大导致梯度爆炸(exploding gradient)
• 𝑊ℎℎ过小会导致梯度消失(vanishing gradient)
思路:设计更复杂的递归单元(recurrent unit/cell)来保留长期关系