CVDL - 循环神经网络
十、循环神经网络
10.1 RNN
引入
 
几种形式
- 基本形式
 
 
- 更深
 
 
- 两种网络设计
- Elman Network
 - Jordan Network
 
 
 
- 
双向设计
Bidirectional RNN
 
 
10.2 LSTM
定义
 
- 函数示意图:
 
 
工作流程
单个神经元工作流程:
![]()
RNN工作流程:
![]()
训练问题
- 很不幸,往往RNN训练过程中,反向传播的梯度是并不平滑的,很任意梯度消失或者梯度爆炸。
 
 
 
- 
为什么会这样?
太多的连乘!
 - 
控制方法:学习率的控制(太大则设置只能为xx,太小为xxx)
 
 
LSTM优势
- LSTM本身可以解决上述的训练问题。
 
 
10.3 更多应用
Many to One
 
Many to Many (Output is shorter)
 
Many to Many (No Limitation)
 
10.4 注意力机制
定义
 
示例1:机器翻译
 
 
示例2:图像捕获
 
 
 
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 isSeymour!
 评论

 
 
 
 
 




