5.对偶理论

共轭函数

定义:扩展实值函数 f: \mathbb{R}^n \mapsto [-\infty, \infty] 的共轭函数 f^*: \mathbb{R}^n \mapsto [-\infty, \infty] 定义如下:

f^*(\boldsymbol{y}) = \sup_{\boldsymbol{x} \in \mathbb{R}^n} \left\{ \boldsymbol{x}^\top \boldsymbol{y} - f(\boldsymbol{x}) \right\}, \quad \boldsymbol{y} \in \mathbb{R}^n.

二次共轭函数

定义:扩展实值函数 f: \mathbb{R}^n \rightarrow [-\infty, \infty] 的二次共轭函数 f^{**}: \mathbb{R}^n \rightarrow [-\infty, \infty] 是其共轭函数 f^* 的共轭函数,定义如下:

f^{**}(\boldsymbol{x}) = \sup_{\boldsymbol{y} \in \mathbb{R}^n} \left\{ \boldsymbol{y}^\top \boldsymbol{x} - f^*(\boldsymbol{y}) \right\}, \quad \boldsymbol{x} \in \mathbb{R}^n.

Theorem (共轭定理)

f: \mathbb{R}^n \rightarrow [-\infty, \infty] 为扩展实值函数,其共轭函数和二次共轭函数分别是 f^*f^{**},则如下结论成立:

  1. f(\boldsymbol{x}) \geq f^{**}(\boldsymbol{x}), \forall \boldsymbol{x} \in \mathbb{R}^n;
  2. f 是正常闭凸函数,则 f(\boldsymbol{x}) = f^{**}(\boldsymbol{x}), \forall \boldsymbol{x} \in \mathbb{R}^n;
  3. f 的共轭函数与其闭凸包的共轭函数等价,若 cl(conv(f)) 是正常函数,则 cl(conv(f))(\boldsymbol{x}) = f^{**}(\boldsymbol{x}), \forall \boldsymbol{x} \in \mathbb{R}^n;
  4. f 是凸函数时,三个函数 ff^*f^{**} 中之一是正常函数,则其它两个也是正常函数。

极大极小问题

一个零和博弈的例子:

考虑如下只有两个玩家的零和博弈,其中玩家 A 有 n 个策略,玩家 B 有 m 个策略,若玩家 A 选择策略 i 的同时玩家 B 选择策略 j,则玩家 A 需支付 a_{ij} 的报酬给玩家 B,玩家 A 的目标就是最小化他支付的报酬,玩家 B 的目标就是最大化他得到的报酬。不妨设他们都采用混合策略,即玩家 A 按概率分布 x = (x_1, \ldots, x_n) 选择策略,玩家 B 按概率分布 z = (z_1, \ldots, z_m) 选择策略,那么玩家 A 的期望支付报酬就是

\sum_{i=1}^n \sum_{j=1}^m a_{ij} x_i z_j = x^{\top} A z,

其中矩阵 A \in \mathbb{R}^{n \times m}i 行第 j 列的元素是 a_{ij}。若每个玩家都考虑最坏的情况,即玩家 A 最小化 \max_z x^{\top} A z,玩家 B 最大化 \min_x x^{\top} A z,不难看出这两个问题就是上面的极大极小问题。

极大极小问题的定义

\phi: X \times Z \to \mathbb{R} 是闭凸函数,其中 XZ 分别是 \mathbb{R}^n\mathbb{R}^m 的非空子集,考虑如下的极大极小问题:

极大极小问题

强对偶关系

那我们很自然就想了解一个问题,在什么条件下:有如下的极大极小等式,我们也称为强对偶关系成立?并且两个极值都能取到?
\sup_{z \in Z} \inf_{x \in X} \phi(x, z) = \inf_{x \in X} \sup_{z \in Z} \phi(x, z)

弱对偶关系

我们知道,总是有下面的弱对偶关系成立:
如下弱对偶关系总是成立:

\sup_{z \in Z} \inf_{x \in X} \phi(x, z) \leq \inf_{x \in X} \sup_{z \in Z} \phi(x, z).

这是因为对于 \forall \overline{z} \in Z
\inf_{x \in X} \phi(x, \overline{z}) \leq \inf_{x \in X} \sup_{z \in Z} \phi(x, z).

\overline{z} 再取上确界即可证明弱对偶关系。
因此我们只需要研究在什么条件下有如下关系成立即可:
\sup_{z \in Z} \inf_{x \in X} \phi(x, z) \geq \inf_{x \in X} \sup_{z \in Z} \phi(x, z).

鞍点

定义:若向量 x^* \in Xz^* \in Z 使得
\phi(x^*, z) \leq \phi(x^*, z^*) \leq \phi(x, z^*), \quad \forall x \in X, \forall z \in Z
成立,则称 (x^*, z^*)\phi 的鞍点 (saddle point)。

鞍点示意图

鞍点与极大极小值的关系

  1. (x^*, z^*)\phi 的鞍点当且仅当极大极小等式成立且 x^* 是:
    \min_x \sup_{z \in Z} \phi(x, z) \quad \text{s.t. } x \in X.
  2. z^*
    \max_z \inf_{x \in X} \phi(x, z) \quad \text{s.t. } z \in Z.
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 分类和回归是机器学习可以解决两大主要问题,从预测值的类型上看,连续变量预测的定量输出称为回归;离散变量预测的定性输...
    leon_kbl阅读 6,079评论 0 4
  • 最近在复习和学习数学建模的东西,主要是《数学建模优秀论文精选与点评(2011-2015)》和《数学建模方法及其应用...
    潜度er阅读 1,160评论 0 0
  • 最近在复习和学习数学建模的东西,主要是《数学建模优秀论文精选与点评(2011-2015)》和《数学建模方法及其应用...
    X_Ran_0a11阅读 2,164评论 0 2
  • 1、学习和纯优化有什么不同 在大多数机器学习问题中,我们关注某些性能度量,其定义于测试集上并且可能是不可解的。因此...
    单调不减阅读 3,183评论 0 3
  • activation 激活值 activation function 激活函数 additive noise 加性...
    630d0109dd74阅读 1,050评论 0 1