凸分析

凸分析是研究凸函數與凸集性質的數學分支，其應用稱作凸優化，是最優化理論的子分支。

凸集

某向量空間X的子集 $C\subseteq X$ ，若滿足下列任意一條等價條件，就稱其是凸的（convex）：

若 $0\leq r\leq 1$ 是實數， $x,y\in C$ ，則 $rx+(1-r)y\in C.$ ^[1]
若 $0<r<1$ 是實數， $x,y\in C,\ x\neq y,$ 則 $rx+(1-r)y\in C.$

區間上的凸函數

$f:X\to [-\infty ,\infty ]$ 始終是以擴展實數線 $[-\infty ,\infty ]=\mathbb {R} \cup \{\pm \infty \}$ 為值域、以某向量空間的凸子集 $\operatorname {domain} f=X$ 為定義域的映射。映射 $f:X\to [-\infty ,\infty ]$ ，若

f(rx+(1-r)y)\leq rf(x)+(1-r)f(y)

（凸性

\leq

）

對所有實數 $0<r<1$ 、所有 $x,y\in X,\ x\neq y$ 都成立，稱映射f是凸函數。若此不等式被替換為嚴格不等式

f(rx+(1-r)y)<rf(x)+(1-r)f(y)

（凸性

<

）

對f仍成立，則稱f是嚴格凸的。^[1] 凸函數與凸集有關。特別地，若且唯若函數f的上圖（epigraph）

若且唯若函數（黑色）的上圖（即函數圖像上方區域，綠色）是凸集時，函數是凸的。

二元凸函數

x^{2}+xy+y^{2}

的圖像

\operatorname {epi} f:=\left\{(x,r)\in X\times \mathbb {R} ~:~f(x)\leq r\right\}

是凸集時，函數f是凸的。^[2]擴展實值函數的上圖在凸分析中的作用類似於實值函數圖像在實分析中的作用。特別地，擴展實值函數的上圖提供了幾何直覺，可用於形式化或證明猜想。

函數 $f:X\to [-\infty ,\infty ]$ 的定義域記作 $\operatorname {domain} f$ ，有效域則是集合^[2]

\operatorname {dom} f:=\{x\in X~:~f(x)<\infty \}.

函數 $f:X\to [-\infty ,\infty ]$ ，若且唯若 $\forall x\in \operatorname {domain} f,\ f(x)>-\infty ,\ \operatorname {dom} f\neq \varnothing$ ，稱函數是真凸函數。^[2]這意味着在f的定義域中存在x使 $f(x)\in \mathbb {R}$ ，f也永遠不等於 $f$ $-\infty$ 。換句話說，若函數的定義域非空、永遠不取 $-\infty$ 、不等於 $+\infty$ ，則就是真凸函數。若 $f:\mathbb {R} ^{n}\to [-\infty ,\infty ]$ 是真凸函數，則存在向量 ${\vec {b}}\in \mathbb {R} ^{n}$ 、實數 $r\in \mathbb {R}$ 使得

\forall x,\ f(x)\geq x\cdot b-r

其中 $x\cdot b$ 表示向量的點積。

凸共軛

擴展實值函數 $f:X\to [-\infty ,\infty ]$ （不必凸）的凸共軛是來自X的（連續）對偶空間函數 $f^{*}:X^{*}\to [-\infty ,\infty ]$ ^[3]

f^{*}\left(x^{*}\right)=\sup _{z\in X}\left\{\left\langle x^{*},z\right\rangle -f(z)\right\}

其中，括號 $\left\langle \cdot ,\cdot \right\rangle$ 表示規範對偶性 $\left\langle x^{*},z\right\rangle :=x^{*}(z)$ 。f的雙共軛是映射 $f^{**}=\left(f^{*}\right)^{*}:X\to [-\infty ,\infty ]$ ，定義為 $\forall x\in X,\ f^{**}(x):=\sup _{z^{*}\in X^{*}}\left\{\left\langle x,z^{*}\right\rangle -f\left(z^{*}\right)\right\}$ 將X上的Y值函數記作 $\operatorname {Func} (X;Y)$ ，則 $f\mapsto f^{*}$ 定義的映射 $\operatorname {Func} (X;[-\infty ,\infty ])\to \operatorname {Func} \left(X^{*};[-\infty ,\infty ]\right)$ 乘坐勒讓德-芬切爾變換。

次微分集與芬切爾-揚不等式

若 $x\in X,\ f:X\to [-\infty ,\infty ]$ ，則次微分集（subdifferential set）為

{\begin{alignedat}{4}\partial f(x):&=\left\{x^{*}\in X^{*}~:~f(z)\geq f(x)+\left\langle x^{*},z-x\right\rangle {\text{ for all }}z\in X\right\}&&({\text{“}}z\in X{\text{''}}{\text{ can be replaced with: }}{\text{“}}z\in X{\text{ such that }}z\neq x{\text{''}})\\&=\left\{x^{*}\in X^{*}~:~\left\langle x^{*},x\right\rangle -f(x)\geq \left\langle x^{*},z\right\rangle -f(z){\text{ for all }}z\in X\right\}&&\\&=\left\{x^{*}\in X^{*}~:~\left\langle x^{*},x\right\rangle -f(x)\geq \sup _{z\in X}\left\langle x^{*},z\right\rangle -f(z)\right\}&&{\text{ The right hand side is }}f^{*}\left(x^{*}\right)\\&=\left\{x^{*}\in X^{*}~:~\left\langle x^{*},x\right\rangle -f(x)=f^{*}\left(x^{*}\right)\right\}&&{\text{ Taking }}z:=x{\text{ in the }}\sup {}{\text{ gives the inequality }}\leq .\\\end{alignedat}}

例如，在 $f=\|\cdot \|$ 是X上的範數這一重要特例中，可以證明^{[proof 1]}

若 $0\neq x\in X$ ，則此定義可簡化為：

\partial f(x)=\left\{x^{*}\in X^{*}~:~\left\langle x^{*},x\right\rangle =\|x\|{\text{ and }}\left\|x^{*}\right\|=1\right\}

；

\partial f(0)=\left\{x^{*}\in X^{*}~:~\left\|x^{*}\right\|\leq 1\right\}.

$\forall x\in X,\ x^{*}\in X^{*},\ f(x)+f^{*}\left(x^{*}\right)\geq \left\langle x^{*},x\right\rangle ,$ 這就是芬切爾-揚不等式，若且唯若 $x^{*}\in \partial f(x)$ 時是等式。正是通過這種方式，次微分集 $\partial f(x)$ 與凸共軛 $f^{*}\left(x^{*}\right)$ 直接相關。

雙共軛

函數 $f:X\to [-\infty ,\infty ]$ 的雙共軛是共軛的共軛，一般寫作 $f^{**}:X\to [-\infty ,\infty ]$ 。雙共軛有助於顯示強對偶或弱對偶何時成立（通過擾動函數）。

$\forall x\in X,$ 不等式 $f^{**}(x)\leq f(x)$ 符合芬切爾-揚不等式。對緊合（proper）的函數，若且唯若f是凸的下半連續函數時， $f=f^{**}$ （芬切爾–莫羅定理）。^[3]^[4]

凸最小化

凸最小化（主）問題形如

給定凸函數

f:X\to [-\infty ,\infty ]

與凸子集

M\subseteq X

，求

\inf _{x\in M}f(x)

對偶問題

優化理論中，對偶原則（duality principle）指出，優化問題可以從兩個角度分別視作主問題與對偶問題。

一般來說，給定一對分離的局部凸空間 $\left(X,X^{*}\right)$ 、 $\left(Y,Y^{*}\right)$ ，以及函數 $f:X\to [-\infty ,\infty ]$ ，可以把主問題定義為求x使得

\inf _{x\in X}f(x).

可令 $f=f+I_{\mathrm {constraints} }$ （其中I是示性函數）將約束嵌入f。那麼讓 $F:X\times Y\to [-\infty ,\infty ]$ 是擾動函數，使得 $F(x,0)=f(x)$ 。^[5]

關於所選擾動函數的對偶問題由下式給出：

\sup _{y^{*}\in Y^{*}}-F^{*}\left(0,y^{*}\right)

其中 $F^{*}$ 是F兩個變量的凸共軛。

對偶間隙是不等式左右兩式的差^[6]^[5]^[7]

\sup _{y^{*}\in Y^{*}}-F^{*}\left(0,y^{*}\right)\leq \inf _{x\in X}F(x,0).

此原理同弱對偶。若兩側相等，則問題滿足強對偶。強對偶成立的條件有很多，如

$F=F^{**}$ ，其中F是連接主問題與對偶問題的擾動函數， $F^{**}$ 是F的雙共軛；^{[來源請求]}
主問題是線性規劃問題；
凸優化問題的斯萊特條件。^[8]^[9]

拉格朗日對偶性

對不等式約束的凸最小化問題，

\min {}_{x}f(x)

subject to

g_{i}(x)\leq 0

，其中

i=1,\ldots ,m.

其拉格朗日對偶問題是

\sup {}_{u}\inf {}_{x}L(x,u)

subject to

u_{i}(x)\geq 0

，其中

i=1,\ldots ,m.

其中目標函數 $L(x,u)$ 是如下定義的拉格朗日對偶函數：

L(x,u)=f(x)+\sum _{j=1}^{m}u_{j}g_{j}(x)

另見

凸性 (經濟學)
- 非凸 (經濟學)

註釋

^ ^1.0 ^1.1 Rockafellar, R. Tyrrell. Convex Analysis. Princeton, NJ: Princeton University Press. 1997 [1970]. ISBN 978-0-691-01586-6.
^ ^2.0 ^2.1 ^2.2 Rockafellar & Wets 2009，第1-28頁.
^ ^3.0 ^3.1 Zălinescu 2002，第75-79頁.
^ Borwein, Jonathan; Lewis, Adrian. Convex Analysis and Nonlinear Optimization: Theory and Examples 2. Springer. 2006: 76–77. ISBN 978-0-387-29570-1.
^ ^5.0 ^5.1 Boţ, Radu Ioan; Wanka, Gert; Grad, Sorin-Mihai. Duality in Vector Optimization. Springer. 2009. ISBN 978-3-642-02885-4.
^ Zălinescu 2002，第106-113頁.
^ Csetnek, Ernö Robert. Overcoming the failure of the classical generalized interior-point regularity conditions in convex optimization. Applications of the duality theory to enlargements of maximal monotone operators. Logos Verlag Berlin GmbH. 2010. ISBN 978-3-8325-2503-3.
^ Borwein, Jonathan; Lewis, Adrian. Convex Analysis and Nonlinear Optimization: Theory and Examples 2. Springer. 2006. ISBN 978-0-387-29570-1.
^ Boyd, Stephen; Vandenberghe, Lieven. Convex Optimization (PDF). Cambridge University Press. 2004 [2011-10-03]. ISBN 978-0-521-83378-3. （原始內容存檔 (PDF)於2021-05-09）.

^ $X=\{0\}$ 則結論是直接的（平凡），所以假設不這樣（非平凡）。固定 $x\in X$ ，將f換成範數，給出 $\partial f(x)=\left\{x^{*}\in X^{*}~:~\left\langle x^{*},x\right\rangle -\|x\|\geq \left\langle x^{*},z\right\rangle -\|z\|\forall z\in X\right\}$ 。若 $x^{*}\in \partial f(x),\ r\geq 0$ 是實數，則 $z:=rx$ 給出 $\left\langle x^{*},x\right\rangle -\|x\|\geq \left\langle x^{*},rx\right\rangle -\|rx\|=r\left[\left\langle x^{*},x\right\rangle -\|x\|\right],$ 特別地取 $r:=2$ 則有 $x^{*}(x)\geq \|x\|$ ，而取 $r:={\frac {1}{2}}$ 則有 $x^{*}(x)\leq \|x\|$ 於是 $x^{*}(x)=\|x\|$ ；若還 $x\neq 0$ 則因 $x^{*}\left({\frac {x}{\|x\|}}\right)=1,$ 由對偶範數的定義可知 $\left\|x^{*}\right\|\geq 1.$ 由於 $\partial f(x)\subseteq \left\{x^{*}\in X^{*}~:~x^{*}(x)=\|x\|\right\},$ 其等價於 $\partial f(x)=\partial f(x)\cap \left\{x^{*}\in X^{*}~:~x^{*}(x)=\|x\|\right\},$ 可知 $\partial f(x)=\left\{x^{*}\in X^{*}~:~x^{*}(x)=\|x\|{\text{ and }}\|z\|\geq \left\langle x^{*},z\right\rangle {\text{ for all }}z\in X\right\},$ 於是 $\left\|x^{*}\right\|\leq 1,\ \forall x^{*}\in \partial f(x).$ 從這些事實，可以得到結論。∎

參考文獻

^[1]
^[2]
Hiriart-Urruty, J.-B.; Lemaréchal, C. Fundamentals of convex analysis. Berlin: Springer-Verlag. 2001. ISBN 978-3-540-42205-1.
Kusraev, A.G.; Kutateladze, Semen Samsonovich. Subdifferentials: Theory and Applications. Dordrecht: Kluwer Academic Publishers. 1995. ISBN 978-94-011-0265-0.
^[3]
^[4]
Singer, Ivan. Abstract convex analysis. Canadian Mathematical Society series of monographs and advanced texts. New York: John Wiley & Sons, Inc. 1997: xxii+491. ISBN 0-471-16015-6. MR 1461544.
Stoer, J.; Witzgall, C. Convexity and optimization in finite dimensions 1. Berlin: Springer. 1970. ISBN 978-0-387-04835-2.
^[5]

外部連結

維基共享資源上的相關多媒體資源：凸分析

參考資料

^ Bauschke & Combettes 2017，第1-2頁.
^ Boyd & Vandenberghe 2004，第1-2頁.
^ Rockafellar & Wets 2009.
^ Rudin 1991.
^ Zălinescu 2002，第1-2頁.

[Rockafellar-1] 1.0 ^1.1 Rockafellar, R. Tyrrell. Convex Analysis. Princeton, NJ: Princeton University Press. 1997 [1970]. ISBN 978-0-691-01586-6.

[FOOTNOTERockafellarWets20091-28-2] 2.0 ^2.1 ^2.2 Rockafellar & Wets 2009，第1-28頁.

[FOOTNOTEZălinescu200275-79-3] 3.0 ^3.1 Zălinescu 2002，第75-79頁.

[BorweinLewis-5] Borwein, Jonathan; Lewis, Adrian. Convex Analysis and Nonlinear Optimization: Theory and Examples 2. Springer. 2006: 76–77. ISBN 978-0-387-29570-1.

[BWG-6] 5.0 ^5.1 Boţ, Radu Ioan; Wanka, Gert; Grad, Sorin-Mihai. Duality in Vector Optimization. Springer. 2009. ISBN 978-3-642-02885-4.

[FOOTNOTEZălinescu2002106-113-7] Zălinescu 2002，第106-113頁.

[Csetnek_2010-8] Csetnek, Ernö Robert. Overcoming the failure of the classical generalized interior-point regularity conditions in convex optimization. Applications of the duality theory to enlargements of maximal monotone operators. Logos Verlag Berlin GmbH. 2010. ISBN 978-3-8325-2503-3.

[borwein-9] Borwein, Jonathan; Lewis, Adrian. Convex Analysis and Nonlinear Optimization: Theory and Examples 2. Springer. 2006. ISBN 978-0-387-29570-1.

[boyd-10] Boyd, Stephen; Vandenberghe, Lieven. Convex Optimization (PDF). Cambridge University Press. 2004 [2011-10-03]. ISBN 978-0-521-83378-3. （原始內容存檔 (PDF)於2021-05-09）.

[4] $X=\{0\}$ 則結論是直接的（平凡），所以假設不這樣（非平凡）。固定 $x\in X$ ，將f換成範數，給出 $\partial f(x)=\left\{x^{*}\in X^{*}~:~\left\langle x^{*},x\right\rangle -\|x\|\geq \left\langle x^{*},z\right\rangle -\|z\|\forall z\in X\right\}$ 。若 $x^{*}\in \partial f(x),\ r\geq 0$ 是實數，則 $z:=rx$ 給出 $\left\langle x^{*},x\right\rangle -\|x\|\geq \left\langle x^{*},rx\right\rangle -\|rx\|=r\left[\left\langle x^{*},x\right\rangle -\|x\|\right],$ 特別地取 $r:=2$ 則有 $x^{*}(x)\geq \|x\|$ ，而取 $r:={\frac {1}{2}}$ 則有 $x^{*}(x)\leq \|x\|$ 於是 $x^{*}(x)=\|x\|$ ；若還 $x\neq 0$ 則因 $x^{*}\left({\frac {x}{\|x\|}}\right)=1,$ 由對偶範數的定義可知 $\left\|x^{*}\right\|\geq 1.$ 由於 $\partial f(x)\subseteq \left\{x^{*}\in X^{*}~:~x^{*}(x)=\|x\|\right\},$ 其等價於 $\partial f(x)=\partial f(x)\cap \left\{x^{*}\in X^{*}~:~x^{*}(x)=\|x\|\right\},$ 可知 $\partial f(x)=\left\{x^{*}\in X^{*}~:~x^{*}(x)=\|x\|{\text{ and }}\|z\|\geq \left\langle x^{*},z\right\rangle {\text{ for all }}z\in X\right\},$ 於是 $\left\|x^{*}\right\|\leq 1,\ \forall x^{*}\in \partial f(x).$ 從這些事實，可以得到結論。∎

[FOOTNOTEBauschkeCombettes20171-2-11] Bauschke & Combettes 2017，第1-2頁.

[FOOTNOTEBoydVandenberghe20041-2-12] Boyd & Vandenberghe 2004，第1-2頁.

[FOOTNOTERockafellarWets2009-13] Rockafellar & Wets 2009.

[FOOTNOTERudin1991-14] Rudin 1991.

[FOOTNOTEZălinescu20021-2-15] Zălinescu 2002，第1-2頁.

[1]

[2]

[3]

[proof 1]

[4]

[5]

[6]

[7]

[8]

[9]

[1]

[2]

[3]

[4]

[5]