LSTM 和 GRU
概括来说,LSTM和CRU都是通过各种门函数来将重要特征保留下来,这样就保证了在long-term传播的时候也不会丢失
examples: https://www.jianshu.com/p/9133900e7e66
GRU 和 LSTM 时间序列预测就是把 loss 画出来
https://zhuanlan.zhihu.com/p/67832773
CTC
Connectionist Temporal Classification (CTC)正适合这种不知道输入输出是否对齐的情况使用的算法,所以CTC适合语音识别和手写字符识别的任务
https://www.jianshu.com/p/0cca89f64987