(2)分析算法

一、了解基本定义

1.算法定义

算法：就是定义良好的计算过程该过程取某个值或值的集合作为输入并产生某个值或值的集合作为输出。

比如排序问题的形式定义：
输入： n个数的一个序列<a1,a2,...,an>
输出：输入序列的一个排序<a1,a2,...,an> ,满足a1<=a2<=...an

2.数据结构

数据结构是存储和组织数据的一种方式，以便对数据迕行访问和修改。没有一种数据结构可以适用于所有用途和目的，因此了解数据结构的长处和局限性相当重要。

3.效率

衡量算法效率的常用标准是速度。

二、分析算法

1.分析算法

分析算法的结果意味着预测算法需要的资源。虽然有时候我们主要关心像内存、计算机硬件、通信带宽这类的硬件资源，但是通常我们想度量的是计算时间。一般来说，通过分析求解某个问题的几种候选算法，我们在其中选择一种最有效的算法。这种分析可能会指出不止一个的可行的候选算法，但是在这个过程中，我们往往可以抛弃几个较差的算法。

2.输入规模

输入规模的最佳概念依赖于研究的问题，对于许多问题，如排序或者计算离散傅里叶变换，最自然的量度就是通常的二进制记号表示输入所需的总位数。

3.运行时间

运行时间是指执行的基本操作或步数，定义‘步’的概念以便尽量独立于机器的，假定第i 行的每部执行所需时间为Ci,Ci是一个常量

比如下面是插入排序的一个伪代码模型，现在来该算法运行时间,其中A为一个数组,先不管算法如何实现

insert-sort(A) 　　　　　代价　　　次数
for j=2 to A.length 　　　　1 　　　　 n
　key=A[j]　　　　　　　c2 　　　　n-1
　i=j-1　　　　　　　　 c3 　　　　n-1
while i>0 and A[i]>key　　c4 　　　 $\sum_{j=2}^n tj$
　A[i+1]=A[i]　　　　　　c5 　　　 $\sum_{j=2}^n (tj-1)$
　i=i-1　　　　　　　　　c6 　　　 $\sum_{j=2}^n (tj-1)$
　A[i]=key　　　　　　　c7 　　　n-1

循环头次数会被循环体次数多1,多的一次为循环头发现不满足数据时，就退出了，导致了循环头比循环体多了1次

列出了代价和次数，接下来很容易能求得：
T(n)=c1n+c2(n−1)+c3(n−1)+c4 $\sum_{j=2}^n tj$ +c5 $\sum_{j=2}^n (tj-1)$ +c6 $\sum_{j=2}^n (tj-1)$ +c7(n−1)

最好分析

当i取其值j-1时，有A[i]<=key ,那么条件不成立，那么对j = 2,3,...,n,有tj=1 是有最佳的运行时间,简单表示为：
　　　　　　　T(n)=an+b

最坏的情况

插入值必须和之前的每一个数比较过去，即 while循环就一共就比较了j次（算最后循环的一次）
简化T(n)可以表示为：
　　　　　　　T(n)= $an^2$ +bn+c
因此他是n的二次函数

4.增长量级

我们使用某些简化的抽象来使算法分析的过程更加容易。我们真正感兴趣的运行时间的增长率或增长量级。所以我们只考虑公式中最重要的项（例如an^2）,当n很大时，低阶项相对于来说不太重要，我们也忽略了最重要项的常系数，因为对对大的输入，在确定计算效率时常量因子不如增长率重要。
对于插入排序，当我们忽视低阶项和最重要项的常系数时，只剩下最重要的项中的因子 $n^2$ 。

5.如何比较算法有效性

如果一个算法的最坏情况运行时间具有比另一个算法更低的增长量级，那么我们通常认为前者比后者更有效。
对于小的输入，有可能会有较高增量量级的运行快

三、渐近记号Θ、Ο、o、Ω、ω详解

1.渐近精确界记号：Θ（big-theta）

假设算法A的运行时间表达式T1(n)为：T1(n)=30 $n^4$ +20 $n^3$ +40 $n^2$ +46n+100
假设算法B的运行时间表达式T2(n)为：T2(n)=1000 $n^3$ +50 $n^2$ +78n+10
当问题规模足够大的时候，例如n=100万，算法的运行时间将主要取决于时间表达式的第一项，其它项的执行时间只有它的几十万分之一，可以忽略不计。第一项的常数系数，随着n的增大，对算法的执行时间也变得不重要了。
于是，算法A的运行时间可以记为：T1(n)≈n $^4$ ，记为T1(n)=Θ(n $^4$ )；算法B的运行时间可以记为：T2(n)≈n $^4$ ，记为T2(n)=Θ(n $^4$ )。

Θ的数学含义:
Θ(g(n))={f(n):存在正常量c1、c2和n₀，使得对所有n≥n₀，有0≤c1g(n)≤f(n)≤c2g(n)}若存在正常量c1、c2，使得对于足够大的n，函数f(n)能“夹入”c1g(n)与c2g(n)之间，则f(n)属于集合Θ(g(n))，记作f(n)∈Θ(g(n))。作为代替，我们通常记“f(n)=Θ(g(n))”。

由下图中左侧f(n)=Θ(g(n))图可以看出，对所有n>n₀时，函数f(n)乘一个常量因子可等于g(n)，我们称g(n)是f(n)的一个渐近紧确界。Θ记号在五个记号中，要求是最严格的，因为g(n)即可以表示上界也可以表示下界

渐近符号.png

需要注意的是：Θ(g(n))的定义要求每个成员f(n)∈Θ(g(n))均渐近非负，即当n足够大时，f(n)非负。渐近正函数就是对所有足够大的n均为正的函数。

2.渐近上界记号：O(big-oh)

定义：设f(n)和g(n)是定义域为自然数集N上的函数。若存在正数c和n₀，使得对一切n≥n₀都有0≤f(n)≤cg(n)成立，则称f(n)的渐进的上界是g(n)，记作f(n)=O(g(n))。通俗的说n满足一定条件范围内，函数f(n)的阶不高于函数g(n)。

根据符号O的定义，用它评估算法的复杂度得到的只是问题规模充分大时的一个上界。这个上界的阶越低，评估越精确，越有价值。

例如：设f(n)= $n^2$ +n,则
f(n)=O( $n^2$ )，则 0≤ $n^2$ +n≤c $n^2$ ，求解取c=2,n₀=1即可满足
f(n)=O( $n^3$ )，则0≤ $n^2$ +n≤c $n^3$ ，取c=1,n₀=2即可。显然，O( $n^2$ )作为上界更为精确。

几种常见的复杂度关系:

O(1)<O(logn)<O(n)<O(nlogn)<O( $n^2$ )<O( $2^n$ )<O(n!)<O( $n^n$ )
需要注意的是：对数函数在没有底数时，默认底数为2；如lgn=logn=log2n因为计算机中很多程序是用二分法实现的。

3.渐近下界记号：Ω(big-omege)

定义：设f(n)和g(n)是定义域为自然数集N上的函数。若存在正数c和n₀，使得对一切n≥n₀都有0≤cg(n)≤f(n)成立，则称f(n)的渐进的下界是g(n)，记作f(n)=Ω(g(n))。通俗的说n满足一定条件范围内，函数f(n)的阶不低于函数g(n)。

根据符号Ω的定义，用它评估算法的复杂度得到的只是问题规模充分大时的一个下界。这个下界的阶越高，评估越精确，越有价值。

例如：设f(n)= $n^2$ +n,则
f(n)=Ω( $n^2$ )，则 c $n^2$ ≤ $n^2$ +n，取c=1,n₀=1即可
f(n)=Ω(100n)，则 c100n ≤ $n^2$ +n,取c=1/100 ,n0=1即可

显然，Ω( $n^2$ )作为下界更为精确。

4.非渐近紧确上界：o(小-oh)

定义1：设f(n)和g(n)是定义域为自然数集N上的函数。若对于任意正数c，都存在n₀，使得对一切n≥n₀都有0≤f(n)<cg(n)成立，则称f(n)的渐进的非紧确上界是g(n)，记作f(n)=o(g(n))。通俗的说n满足一定条件范围内，函数f(n)的阶低于函数g(n)。

由O记号提供的渐近上界可能是渐近紧确的，也可能是非紧确的。（如：2 $n^2$ =O( $n^2$ )是渐近紧确的，而2n=O( $n^2$ )是非紧确上界。）
例子：f(n)= $n^2$ +n，则f(n)=o( $n^3$ )

5.非渐近紧确下界：ω(小-omege)

定义1：设f(n)和g(n)是定义域为自然数集N上的函数。若对于任意正数c，都存在n₀，使得对一切n≥n₀都有0≤cg(n)<f(n)成立，则称f(n)的渐进的非紧确下界是g(n)，记作f(n)=ω(g(n))。通俗的说n满足一定条件范围内，函数f(n)的阶高于函数g(n)。

ω记号与Ω的关系类似于o和O记号的关系。我们用ω表示一个非渐近紧确的下界。
例子：f(n)= $n^2$ +n，则f(n)=ω(n)是正确的。f(n)=ω( $n^2$ )则是错误的，f(n)=Ω( $n^2$ )是正确的。

6.渐近记号Θ、Ο、o、Ω、ω关系

记号	含义	通俗理解
(1)Θ（西塔）	紧确界	相当于”=”
(2)O （大欧）	上界	相当于”<=”
(3)o（小欧）	非紧的上界	相当于”<”
(4)Ω（大欧米伽）	下界	相当于”>=”
(5)ω（小欧米伽）	非紧的下界	相当于”>”

最后编辑于：2018.08.15 11:36:53

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,734评论 6赞 505
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,931评论 3赞 394
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,133评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,532评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,585评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,462评论 1赞 302
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,262评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,153评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,587评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,792评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,919评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,635评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,237评论 3赞 329
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,855评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,983评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,048评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,864评论 2赞 354