次梯度法是求解凸函式最佳化凸最佳化)問題的一種迭代法。次梯度法能夠用於不可微的目標函式。當目標函式可微時,對於無約束問題次梯度法與梯度下降法具有同樣的搜尋方向。

雖然在實際的應用中,次梯度法比內點法牛頓法慢得多,但是次梯度法可以直接應用於更廣泛的問題,次梯度法只需要很少的儲存需求。然而,通過將次梯度法與分解技術結合,有時能夠開發出問題的簡單分配演算法。

基本次梯度演算法

編輯

 為定義在 上的凸函式。次梯度演算法使用以下的迭代格式

 

其中 表示函式  次梯度. 如果  可微,他的次梯度就是梯度向量  ,有時 不是函式  處的下降方向。因此採用一系列可能的 來追蹤目標函式的極小值點,即

 

步長的選取

編輯

次梯度方法有許多可採用的步長。以下為5種能夠保證收斂性的步長規則

  • 恆定步長, 
  • 恆定間隔, ,得出 
  • 步長平方可加,但步長不可加,即步長滿足
 
  • 步長不可加但步長遞減,即步長滿足
 
  • 間隔不可加但間隔遞減,即 ,其中
 。注意:上述步長是在演算法執行前所確定的,不依賴於演算法執行過程中產生的任何資料。這是與標準梯度下降法的顯著區別。

收斂結果

編輯

對於恆定間隔的步長以及恆定步長,次梯度演算法收斂到最佳值的某個鄰域,即

 。基本次梯度演算法的效能較差,因此一般的最佳化問題並不推薦使用。

有約束最佳化

編輯

投影次梯度演算法

編輯

次梯度法的一個擴充版本是投影次梯度法,該方法用於求解有約束最佳化問題

最小化 

其中 為凸集。投影次梯度算方法的迭代公式為

 

其中 是在 上的投影, 是在點  的次梯度。

一般約束問題

編輯

次梯度法可延伸到求解不等式約束問題

最小化 

其中 為凸函式。該演算法與無約束最佳化問題具有相同的形式

 

其中 是步長, 是目標函式或約束函式在 處的次梯度

 

其中 代表 的次微分。如果當前點為可行點,演算法採用目標函式的次梯度,否則採用任一違反約束的函式的次微分。

參考資料

編輯

外部連結

編輯