梯度下降算法的工作原理

極市導(dǎo)讀
?梯度下降算法是工業(yè)中最常用的機(jī)器學(xué)習(xí)算法之一,但也是很多新手難以理解的算法之一。如果你剛剛接觸機(jī)器學(xué)習(xí),那么梯度下降算法背后的數(shù)學(xué)原理是比較難理解的。本文將幫助你了解梯度下降算法背后的工作原理。?>>加入極市CV技術(shù)交流群,走在計(jì)算機(jī)視覺(jué)的最前沿
介紹

什么是損失函數(shù)
它是一個(gè)函數(shù),用于衡量模型對(duì)任何給定數(shù)據(jù)的性能。損失函數(shù)將預(yù)測(cè)值與期望值之間的誤差進(jìn)行量化,并以單個(gè)實(shí)數(shù)的形式表示出來(lái)。

什么是梯度下降

梯度下降法是一種求解函數(shù)局部極小值的迭代優(yōu)化算法。

計(jì)算梯度(斜率),函數(shù)在該點(diǎn)的一階導(dǎo)數(shù) 在與梯度相反的方向上移動(dòng)一步(移動(dòng))

繪制梯度下降算法


α-學(xué)習(xí)率
如果學(xué)習(xí)率太高,我們可能會(huì)超過(guò)最小值,而不會(huì)達(dá)到最小值 如果學(xué)習(xí)率太低,訓(xùn)練時(shí)間可能會(huì)太長(zhǎng)


局部最小值

梯度下降的Python代碼實(shí)現(xiàn)

結(jié)尾
推薦閱讀

評(píng)論
圖片
表情
