1. 解决梯度消失 换激活函数(ReLU) 换网络(LSTM、把网络改浅) batch normalization 残差网络 pretrain-finetune 2. 解决梯度爆炸 梯度裁剪 参数正则化 batch normalization 换激活函数ReLU