反向传播算法(Back Propagation,简称BP),指的是计算loss函数的结果L对计算图中各个参数的梯度。
梯度下降法(Gradient Descent),指的是在获得梯度的前提下,怎么更新参数、参数更新多少的问题,直观理解是“知道了梯度大小和方向,要沿着梯度方向走多远”。
反向传播算法(Back Propagation,简称BP),指的是计算loss函数的结果L对计算图中各个参数的梯度。
梯度下降法(Gradient Descent),指的是在获得梯度的前提下,怎么更新参数、参数更新多少的问题,直观理解是“知道了梯度大小和方向,要沿着梯度方向走多远”。