本文参考吴恩达机器学习课程第2章
线性回归公式:
代价公式(误差均值中的2用来抵消求导得来的2):
目标:代价最小化
这里演示单变量线性回归时:
令,
可对求导,
此时方可求出
实际上,由于代价函数经常含有2个及以上参数,目前函数处于三维空间x, y, z分别为,无法直接求导获得最佳参数组合
所以我们实际上,是不断尝试不同的值,找到损失结果最小的那组。
我们如何找到合适的尝试方法来找到这组参数呢,目前使用梯度下降法
算法特点:从不同的起始值开始,获得的局部最优解是不一样
为了方便,设
为学习率(不变),为偏导数,参数更新公式:
()
具体展开:
达到局部最优解时(图中某一处局部最低点时),此时导数项为0,,参数不再更新,且随着接近最低点,导数项也会越来越小,所以暂时学习率可不变。
梯度下降可以用于更新任何可微(因为需要求导)的代价函数J,目前使用的梯度下降用到了,意味着每下降一次遍历一整个数据集,也称batch梯度下降算法。