浅谈梯度下降法

浅谈梯度下降法

ID:42183306

大小:203.02 KB

页数:5页

时间:2019-09-09

浅谈梯度下降法_第1页
浅谈梯度下降法_第2页
浅谈梯度下降法_第3页
浅谈梯度下降法_第4页
浅谈梯度下降法_第5页
资源描述:

《浅谈梯度下降法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、浅谈梯度下降法询些时间接触了机器学习,发现梯度下降法是机器学习里比较基础又比较重要的一个求最小值的算法。梯度下降算法过程如下:1)随机初始值兔;2)迭代aM=ak^aksk,直至收敛。/表示在色处的负梯度方向,匕表示学习率。在这里,简单谈一下自己对梯度下降法的理解。首先,要明确梯度是一个向量,是一个n元函数f关于n个变量的偏导数,比如三元函数f的梯度为(fx/fy/fz),二元函数f的梯度为(fx,fy),—元函数f的梯度为位然后要明白梯度的方向是函数f增长最快的方向,梯度的反方向是f降低最快的方向。我们以一元函数为例,介绍一下梯度下降法。设f(x)=上图给出了函数f的图像和初始值X。,我们

2、希望求得函数f的最小值,因为沿负梯度方向移动一小步后,f值降低,故只需X。沿着负梯度方向移动一小步即可。而f在点Xo的导数大于0,从而f在点X。的梯度方向为正,即梯度方向为f'(Xo),故由梯度下降法可知,下一个迭代值兀严兀o+兔•(一八兀())),也就是说X。向左移动一小步到了X],同理在X1点的导数同样大于零,下一次迭代X]向左移动一小步到达X2,—直进行下去,只要每次移动的步数不是很大,我们就可以得到收敛1的解Xo上述证实了我们对分析〈蓝色倾斜字体)的验证。同样,如果处置选在了最小值的左边,即如图所示:由于f(xo)<O,所以梯度方向为负,负梯度方向为正,故需将Xo沿负梯度方向移动一小

3、步,即向右移动一小步,这样使得f值更小一些。或用梯度下降法迭代公式xk^=xk+%•(-广(无)),依次我们可以得到如图所示的Xi,X2,...,Xk,...,直到收敛至最小值。对于二元函数,我们也可以通过实例验证梯度下降法的合理性:505101520253035404550在每次得到一个点(xk,yj时,我们需要计算(fMxk),fy(yJ),这个方向表示梯度f增长最快的方向,-(匚(xj,fy(yj)表示梯度下降最快的方向,故只需将g,yj沿着-(匚(xj,fy(yj)这个方向移动一小步,就可以减少f的值,直至收敛到最小值,如上图所示。谈几点梯度下降法需要注意的地方,也是自己对梯度下降法

4、的理解:1)梯度下降不一定可以收敛到最小值。梯度下降法是收敛到局部最小值,不一定可以收敛到全局最小值。比如:梯度方向向右,负梯度方向向左,从而X。向左移动,逐渐收敛到了局部最小值,而不能收敛到全局最小值。2)学习率的大小要适屮。学习率太小,每次移动步长太小,收敛太慢,这个比较容易理解。学习率太大,每次移动步长大,可能导致不收敛,这里用一个图來表示一下:由于距离最小值点越远,导数越大,从而导致步长越来越大,不会收敛。3)不一定选择负梯度方向,只要是值下降的方向即可。在每一次迭代选择方向时,我们只要选择与梯度方向夹角小于90度的向量的反方向就可,不一定要选择负梯度方向。但由于,满足这样条件的向量

5、不太容易求出,我们就选择了与梯度方向0度的向量的反方向(负梯度方向),而月.这个方向函数值减少的更快,更快的收敛,故是个不错的选择。4)求最大值的梯度上升法。f的梯度方向是f的值增长最快的方向。我们每次沿负梯度方向移动一小步可以逐步收敛到局部最大值,因此我们每次沿梯度方向也可以得到函数f的局部最大值。迭代公式为:务+i=色+°$,这里/表示在务处的梯度方向,与梯度下降法的含义不同。本文由作者结合自己对梯度的理解写出,希望对大家有所帮助,敬请阅读、指正。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。