梯度下降算法
若单个误差为:
则误差和:
代入,得
接下来的任务,就是要找到合适的,使得函数能取到最小值。
这里要用到函数的梯度。梯度是一个向量,它指向函数值上升最快的方向,而梯度的反方向,则指向函数值下降最快的方向。
对于函数f(x)来说,我们要沿着梯度的反方向,去修改x的值,直到走到函数的最小值附近。
对于函数f(x),梯度下降算法的参数修改规则为
其中,为函数f(x)的梯度,为学习速率。
对于函数,对应的梯度下降算法的参数修改规则为
接下来的问题,就是求梯度。
求梯度
函数的梯度的定义就是它相对于各个变量的偏导数,因此有
得到了
之后,接下来的任务就是求
即
因为
所以
代入到,得
将
代入到
最终得到的修改规则为