牛頓迭代法的可視化詳解

來源:DeepHub IMBA 本文約1800字,建議閱讀10分鐘
本文利用可視化方法,為你直觀地解析牛頓迭代法。
Newton-Raphson公式








如果函數(shù)無法手動微分怎么辦?
問題
牛頓法是一種迭代算法,每一步都需要求解目標函數(shù)的Hessian矩陣的逆矩陣,計算比較復(fù)雜。 牛頓法收斂速度為二階,對于正定二次函數(shù)一步迭代即達最優(yōu)解。 牛頓法是局部收斂的,當初始點選擇不當時,往往導(dǎo)致不收斂; 二階Hessian矩陣必須可逆,否則算法進行困難。
與梯度下降法的對比
牛頓法使用的是目標函數(shù)的二階導(dǎo)數(shù),在高維情況下這個矩陣非常大,計算和存儲都是問題。 在小批量的情況下,牛頓法對于二階導(dǎo)數(shù)的估計噪聲太大。 目標函數(shù)非凸的時候,牛頓法容易受到鞍點或者最大值點的吸引。
評論
圖片
表情
