算法好坏评估
高级语言编写的程序在计算机上运行时所消耗的时间取决于下列因素:
- 算法采用的策略,方案
- 编译产生的代码质量
- 问题的输入规模
- 机器执行指令的速度
由此可见,抛开这些与计算机硬件、软件有关的因素,一个程序的运行时间依赖于算法的好坏和问题的输入规模。
判断一个算法的效率时,函数的常数和其他次要项常常可以忽略,而更应该关注主项(最高项)的阶数。
判断一个算法好不好,我们只通过少量的数据是不能做出准确判断的,很容易以偏概全。
算法时间复杂度
算法时间复杂度的定义:在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间度量,记做T(n)=O(f(n))。它表示随着问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称为算法的渐进时间复杂度。其中f(n)是问题规模n的某个函数。
这样用大写O()来体现算法的时间复杂度的记法,我们称之为大O记法。
一般情况下,随着输入规模n的增大,T(n)增长最慢的算法为最优算法。
上面的三条线的关系分别对应的是,,。
推导大O阶方法
如何分析一个算法的时间复杂度呢?即如何推导大O阶。
- 用常数1取代运行时间中所有加法常数。
- 在修改后的运行次数函数中,只保留最高阶项。
- 如果最高阶项存在且不是1,则去掉遇着项相乘的常数。
常数阶
无循环的多条指令的堆叠,不管有多少条指令,大O阶记做 。
线性阶
一般含有非嵌套循环涉及线性阶,线性阶就是随着问题规模n的扩大,对应计算次数呈直线增长。线性阶的时间复杂度为。
平方阶
向下面这段代码的嵌套循环就是平方阶,其时间复杂度为
那么,如果有三个这样的嵌套循环,时间复杂度就是。所以我们很容易总结得出,循环的时间复杂度等于循环体内的复杂度乘以该循环运行的次数。
我们再来看下面这段代码,他的时间复杂度是多少呢?
我们分析:
由于,当i=0时,内循环执行了n次,当i=1时,内循环执行n-1次……当i=n-1时,内循环执行了1次,所以总的执行次数应该是:
我们推导大O应该是。
对数阶
由于每次 i*2 之后,就会距离n更近一步,假设有x个2相乘后大于或等于n,则会退出循环。
于是由 得到 ,所以这个循环的时间复杂度为
常见的时间复杂度
常用的时间复杂度所耗费的时间从小到大依次是:
最坏情况与平均情况
我们查找一个有n个随机数字数组中的某个数字,最好的情况是第一个数组就是,那么算法的时间复杂度为O(1),但也有可能这个数组就在最后一个位置,那么时间复杂度为O(n)。
平均运行时间是期望的运行时间
最坏运行时间是一种保证。在应用中,这是一种最重要的需求,通常除非特别指定,我们提到的运行时间都是最坏情况的运行时间。
算法的空间复杂度
我们在写代码的时候,完全可以用空间来换取时间。例如,要判断某年是不是闰年,有两个方法,第一种方法是每给一个年份,就通过算法计算得到是否闰年的结果。第二中方法是事先建立一个有2050元素的数组,然后把所有年份按下标的数字对应,如果是闰年,则此数组元素的值是1,如果不是元素则为0。这样,所谓的判断某一年是否为闰年的就变成了查找这个数组某一个元素的值的问题。第一种方法比起第二种显然非常节省空间,但每一次查询都需要经过一系列的计算。第二种方法虽然在内存里存储2050个元素的值,但是每次查询只需要一次索引判断即可。
算法的空间复杂度通过计算算法所需的存储空间实现,算法的空间复杂度的计算公式记作:
,其中,n为问题的规模,f(n)为语句关于n所占存储空间的函数。