无约束极值问题的极值条件
最优性条件就是最优化问题的目标函数与约束函数在最优点所满足的充分条件和必要条件
考虑非线性规划问题
minf(x),x∈Rn
其中,f(x) 是定义在Rn 上的实函数。该问题就是求f(x) 在n 维欧氏空间中的极小点,称为无约束极值问题。
下降方向
定理:设函数f(x) 在点xˉ 处可微,若存在方向d 使得∇f(xˉ)⊤d<0,则存在δ>0 使得∀λ∈(0,δ) 有:
f(x+λd)<f(x)
事实上,∇f(xˉ)⊤d 就是函数f(x) 在点xˉ 处的方向导数Df(xˉ;d)。而满足上述条件的方向称为下降方向。
该定理的可以通过对函数f(x+λd) 在xˉ 处的 Taylor 展开式推导得到。
必要条件
一阶必要条件:设函数f(x) 在点xˉ 处可微,若xˉ 是局部极小点,则此处的梯度∇f(xˉ)=0.
证明:反证法. 若∇f(xˉ)=0,令方向d=−∇f(xˉ),则方向导数
∇f(xˉ)⊤d=−∇f(xˉ)⊤∇f(xˉ)=−∥∇f(xˉ)∥2<0
满足前述定理的条件,所以应该有f(x+λd)<f(x),这与xˉ 是局部极小点的前提矛盾(因为邻域内还有函数值比它小的点)。
注意,该条件为必要条件。所以∇f(xˉ)=0 不能反过来说明xˉ 是局部极小点。梯度为0的点可能是极小点、极大点或是鞍点,它们都统称为驻点。
二阶必要条件:设函数f(x) 在点xˉ 处二次可微,若xˉ 是局部极小点,则此处的梯度∇f(xˉ)=0,且 Hesse 矩阵∇2f(xˉ) 半正定。
证明:根据一阶必要条件,接下来只需证明海森矩阵半正定即可。
将函数f(x+λd) 在xˉ 处的 Taylor 展开到二阶:
f(x+λd)=f(x)+21λ2d⊤∇2f(x)d+o(∥λd∥2)
移项,然后两边同时除以λ2,得:
λ2f(x+λd)−f(x)=21d⊤∇2f(x)d+λ2o(∥λd∥2)
自然,当∣λ∣ 充分小时,由于xˉ 是局部极小点所以f(x+λd)≥f(x),从而得到:
d⊤∇2f(x)d≥0
即Hesse 矩阵∇2f(xˉ) 半正定。证毕。
充分条件
二阶充分条件:设函数f(x) 在点xˉ 处二次可微,若此处的梯度∇f(xˉ)=0,且 Hesse 矩阵∇2f(xˉ) 正定(不是半正定),则xˉ 是局部极小点。
证明:已知∇f(xˉ)=0,现将函数f(x) 在xˉ 处的 Taylor 展开到二阶:
f(x)=f(x)+21(x−x)⊤∇2f(x)(x−x)+o(∥(x−x)∥2)
设 Hesee 矩阵的最小特征值为λmin,则中间项:
(x−x)⊤∇2f(x)(x−x)≥λmin∥(x−x)∥2
从而有:
f(\boldsymbol x)\geq f(\overline{\boldsymbol x})+\left(\frac12\lambda_\min +\frac{o\left(\Vert(\boldsymbol{x-\overline{x}})\Vert^2\right)}{\Vert(\boldsymbol{x-\overline{x}})\Vert^2}\right)\Vert(\boldsymbol{x-\overline{x}})\Vert^2所以,当x→x 时,∃ϵ>0,x∈N(xˉ,ϵ),f(x)≥f(x).
即xˉ 是局部极小点。证毕。
充要条件
考虑凸性函数时,可以得出全局极小点的充分必要条件。
无约束凸函数极值条件:设f(x) 是定义在Rn 上的可微凸函数,xˉ∈Rn,则xˉ 是全局极小点的充分必要条件是此处的梯度∇f(xˉ)=0。
另:若f(x) 是严格凸函数,则全局极小点唯一。
约束极值问题的最优性条件
有约束的极值问题一般表示如下:
mins. t. f(x)gi(x)≥0,i=1,...,mhj(x)=0,j=1,...,l
可行方向
规定:
- 可行域:满足约束条件(包括不等式约束和等式约束)的点的集合,记为S;
- 下降方向集:由所有下降方向组成的集合,根据其定义可记为F0={d∣∇f(xˉ)⊤d<0};
类比无约束问题,我们要考察局部极小点,我们就需要衡量是否点xˉ 在其邻域内沿着可能的所有方向移动后函数值不会再减小。由于有着约束条件的制约,我们还需要考虑这些方向是不是可以让xˉ 移动后仍然在可行域内。由此我们还需引入可行方向的概念。
定义:设集合S⊂Rn,xˉ∈clS(i.e.xˉ 在S 的闭包内),d=0,若∃δ>0,∀λ∈(0,δ) 使得
xˉ+λd∈S
则称这样的方向为S 在xˉ 的可行方向。可行方向锥就是所有可行方向组成的集合,记为D。
显然,若xˉ 是局部极小点,那么它的可行方向就一定不是下降方向。换言之,有F0∩D=∅.
不等式约束问题
经过前面的描述,我们已经初步有了应对带约束的问题时如何判断局部最优解的方法:F0∩D=∅. 现在为了用代数的方法来表示,我们先分析只带有不等式约束的问题,并且引入起作用约束的概念。
mins. t. f(x)gi(x)≥0,i=1,...,m
该问题的约束条件在某个点xˉ∈S 时存在两种情况:
gi(x)=0,i∈Igi(x)>0,i∈I
使得等式成立的这些约束我们称为起作用约束,它们的下标集用I 表示。对应地,剩下的约束就是不起作用约束。
事实上,xˉ 坐落在起作用约束的边界上,此时如果xˉ 往某些方向d 移动,无论步长λ 有多小,它都会离开限定的约束而成为不可行点。这也是这种约束被称为起作用约束的原因。对于不起作用约束, 因为xˉ 暂时坐落在内部,所以它在一定步长下往任意方向都可以移动。
所以考察可行方向,我们可以只考虑当前的起作用约束。称这种可行方向的集合为局部约束方向锥或内方向锥:G0={d∣∇gi(xˉ)⊤d>0,i∈I}. (让xˉ 往gi 的值会变大的方向移动,离开边界)
我们可以自然地得出不等式约束问题下的一个必要条件就是:F0∩G0=∅。
证明
Fritz John 条件
待更
Karush-Kuhn-Tucker 条件
待更
一般约束问题
最优化:拉格朗日乘子法 - LeeLIn。 - 博客园 (cnblogs.com)
FJ&KKT
Lagrange
二阶条件
对偶及鞍点问题
参考
- 陈宝林 编著. 《最优化理论与算法》. 清华大学出版社. IISBN : 978-7-320-11376-8
- 凸优化高质量开源课程 - 美国卡内基梅隆大学
- 【非线性优化】线性约束问题的KKT条件 - 知乎
- 拉格朗日乘子法 - KKT条件 - 对偶问题 - massquantity - 博客园