花书四数值计算

上溢和下溢

计算机中在表示实数时候存在的误差。
一种近似误差是舍入误差。这种舍入误差指的是，指运算得到的近似值和精确值之间的差异。
如果忽略舍入误差，会导致某些理论可行的算法在实践中也可能会失效。

文中的两个舍入误差引起的例子，上溢和下溢。
当大量级的数被近似为∞ 或 −∞ 时发生上溢。
当接近零的数被四舍五入为零时发生下溢

例子： softmax 函数

softMax函数

softmax函数在深度学习中经常用到，必须对上溢和下溢进行数值稳定。

当所有的xi都等于某一常数C，如果C是很小的负数，在计算机中可能对其存在舍入误差直接取0。那么则会发生下溢，反之则会产生上溢。

病态条件

书中对病态条件的描述是

条件数表征函数对于输入的微小变化而变化的快慢。

1.病态系统

首先一个线性系统是否是病态的，需要看这个系统的解受系数矩阵微小变化的扰动情况[1]。
例如现有线性系统:
Ax = b，解方程

很容易得到解为： x1 = -100, x2 = -200. 如果在样本采集时存在一个微小的误差，比如，将 A 矩阵的系数 400 改变成 401：

则得到一个截然不同的解：

x1 = 40000, x2 = 79800.

当解集 x 对 A 和 b 的系数高度敏感，那么这样的方程组就是病态的 (ill-conditioned).

2.条件数

那么，如何评价一个方程组是病态还是非病态的呢？在此之前，需要了解矩阵和向量的 norm，这里具体是计算很简单的 infinity norm，即找行绝对值之和最大，举个例子：

矩阵范数：

1-范数：列和范数，即所有矩阵列向量绝对值之和的最大值

2-范数：谱范数，即A'A矩阵的最大特征值的开平方

∞-范数：行和范数，即所有矩阵行向量绝对值之和的最大值

F-范数：Frobenius范数，即矩阵元素绝对值的平方和再开平方

矩阵范数性质：
1.||A||>=0;
2.||A||=0 iff A=O （零矩阵）; （1和2可统称为正定性）

3.||aA||=|a| ||A||; （齐次性）
4.||A+B||<= ||A|| + ||B||. （三角不等式）
5.||AB||<=||A|| ||B||. （相容性）

理解了这些概念，下面讨论一下衡量方程组病态程度的条件数，首先假设向量 b 受到扰动，导致解集 x 产生偏差：

根据相容性可得

综合上面两个不等式

可得

如果是矩阵A产生的误差，同意可得

其中，条件数定义为：

书中对其条件数定义采用二姐矩阵范数形式：

所以当这个数很大的时候，矩阵其实是对输入误差特别敏感的，在实践中，该错误与求逆过程中的本身数值错误将会进一步复合。

基于梯度的优化方法

我们把需要最小化或者最大话的函数成为目标函数或准则。
当我们对其进行最小化时，我们也将其成为代价函数，损失函数，误差函数。

为了求解这个函数的最小值，我们引入当前点x的导数，导数表示了，如果缩放输入的小变化，才能在输出获得相应的变化。

因此我们可以通过根据导数来不断的往导数的反方向移动一小步来减少f(x)
这种技术被成为梯度下降。

当导数等于0的时候，这表示导数无法提供往哪个方向移动的信息。
这些点被成为临界点或驻点。
局部极小值点意味着f(x) 小于所有附近的点
局部极大值点意味着f(x)大于所有附近的点
有些临界点既不是最小值点，也不是最大值点，这些点被成为鞍点。

使得f(x)取得绝对的最小值点是全局最小值点。函数可能只有一个全局最小点或存在多个全局最小点，还可能存在不是全局最优的局部极小点。
我们通常寻找使 f 非常小的点，但这在任何形式意义下并不一定是最小

多维度输入

针对具有多维输入的函数，我们需要用到偏导数（partial derivative）的概念。
偏导数： ∂∂xif(x) 衡量点 x 处只有 xi 增加时 f(x) 如何变化。
梯度：本意是一个向量（矢量），是包含所有偏导数的向量，
是函数对每个因子求偏导得到的列向量，表示着函数的变化趋势，
表示某一函数在该点处的方向导数沿着该方向取得最大值。记为

Jacobin 矩阵：

Hessian矩阵：

梯度下降，最速下降法，牛顿法。

问题一：[2] 为什么沿着负梯度方向是下降最快的方向?

将目标函数 f(x) 在点 xk 处泰勒展开

由于我们定义了步长 α>0 ，因此，当 gTkdk<0 时， f(x)<f(xk) ，即函数值是下降的。此时 dk 就是一个下降方向。
但是 dk 具体等于什么的时候，可使目标函数值下降最快呢？
由Cauchy-Schwartz不等式（柯西-许瓦兹不等式）可得

当且仅当 dk=gk 时，等号成立， dTkgk 最大（>0）
所以 dk=−gk 时， dTkgk 最小（<0）， f(x) 下降量最大
所以 −gk 是最快速下降方向

问题二：梯度法的步长如何确定?

书中简单提供了三种方式:
1.简单的取一个小常数
2.选择使方向导数消失的步长
3.还有一种方法是根据几个 ϵ 计算 f(x − ϵ∇xf(x))，并选择其中能产生最小目标函数的 ϵ。这种策略被称为线搜索（line search）

line search

对每一个line search过程来说，搜索方向 $d_{k}$ 已经确定了，所以，在一个确定的 $d_{k}$ 上，要找到一个合适的 $\alpha_{k}$ 使得 $\phi(\alpha) = f(x_{k}+\alpha d_{k})$ 这个函数满足 $f(x_{k}+\alpha_{k} d_{k})<f(x_{k})$ ，这就是line search的目的。说白了，就是要找到 $\phi(\alpha_{k})$ 使 $\phi(\alpha)$ 的函数函数值变小。
不变小的话就会像上图那样，不会精确收敛。
但是，要小到什么程度呢？假设小到有可能的“最小”，即：

问题三：负梯度方向真的是最好的方向吗?

梯度是变化的，而梯度下降在一次迭代的过程中假设梯度是固定不变的，所谓的梯度方向只是起始点（xk）的梯度方向，并不一定是起始点和终点之间其他点的梯度方向。

所以梯度方向不一定是下降最快的方向
梯度下降的方向不是最快的方向的原因正是由于梯度方向的变化而决定
梯度变化也即是梯度的导数，即函数的二阶导数来决定的。

[1]病态矩阵与条件数
[2][原创] 再谈最速下降法/梯度法/Steepest Descent

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 198,082评论 5赞 464
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 83,231评论 2赞 375
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 145,047评论 0赞 327
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 52,977评论 1赞 268
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 61,893评论 5赞 359
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 47,014评论 1赞 275
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 36,976评论 3赞 388
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 35,605评论 0赞 254
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 39,888评论 1赞 293
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 34,906评论 2赞 314
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 36,732评论 1赞 328
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 32,513评论 3赞 316
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 37,980评论 3赞 301
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,132评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 30,447评论 1赞 255
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,027评论 2赞 343
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 41,232评论 2赞 339

花书 四 数值计算