第八章 贪婪算法
贪婪算法是指, 在对问题求解时, 总是做出在当前看来是最好的选择。 也就是说, 不从整体最优上加以考虑, 他所做出的是在某种意义上的局部最优解。
贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择,选择的贪心策略必须具备无后效性,即某个状态以前的过程不会影响以后的状态,只与当前状态有关。
[站外图片上传中...(image-c42bf7-1528526626427)]
一般人换零钱的时候也会应用到贪心算法。把$36换散︰$20 > $10 > $5 > $1
书中举出的教室调度和背包问题很好的诠释了贪婪算法的概念
印象最深的还是集合覆盖问题
假设你办了个广播节目, 要让全美 50 个州的听众都收听得到。 因此, 你需要决定在哪些广播台播出。 每个广播台都需要支付费用, 所以你要尽可能少的广播台播出
考虑到每个广播台覆盖特定的区域, 不同广播台的覆盖区域可能重叠
使用下面的贪婪算法可得到非常接近的解:
- 选出这样一个广播台, 即它覆盖了最多的未覆盖州。
- 重复第一步, 直到覆盖了所有的州
贪婪算法的运行时间为 O(n2), 其中 n 为广播台数量
代码实现
# 需要覆盖的州
states_needs = set(['mt', 'wa', 'or', 'id', 'nv', 'ut', 'ca', 'az'])
# 广播站
stations = {}
stations['kone'] = set(['id', 'nv', 'ut'])
stations['ktwo'] = set(['wa', 'id', 'mt'])
stations['kthree'] = set(['or', 'nv', 'ca'])
stations['kfour'] = set(['nv', 'ut'])
stations['kfive'] = set(['ca', 'az'])
final_stations = set()
while states_needs :
best_stations = None
# 覆盖的州
states_covered = set()
# key,value
for station, states_for_station in stations.items() :
convered = states_needs & states_for_station
if(len(convered) > len(states_covered)) :
best_stations = station
states_covered = convered
states_needs -= states_covered
final_stations.add(best_stations)
print(final_stations)
NP 问题
我们来看下维基百科上是怎么定义的
非定常多项式(英语:non-deterministic polynomial,缩写:NP) 时间复杂性类,或称非确定性多项式时间复杂性类,包含了可以在多项式时间内,对一个判定性算法问题的实例,一个给定的解是否正确的算法问题。
NP是计算复杂性理论中最重要的复杂性类之一。它包含复杂性类P,即在多项式时间内可以验证一个算法问题的实例是否有解的算法问题的集合;同时,它也包含NP完全问题,即在NP中“最难”的问题。计算复杂性理论的中心问题,P/NP问题即是判断对任意的NP完全问题,是否有有效的算法,或者NP与P是否相等。
这是例子
比如说,我们不知道81,785,036,517是否为素数,但是要确定277,877是否为81,785,036,517因数,我们可以直接拿去除。针对277,877来验证8,178,503,651是否为质数的动作可在多项式时间内完成,故针对某可能解来验证某数是否为质数的问题是一个P问题。
再取一个例子,假如一件问题要处理的时间非常大,不是多项式时间内可以完成的,但是他可以透过无限的计算器去算,最终计算时间复杂度只有O(nk),那么它就是NP(非确定性多项式时间)问题。
所谓的非确定性是指,用极大的数量去解决来达成多项式时间解决的问题。还有一个典型的例子,就是输出n个元素的全排列。即使是非确定机,也不能在多项式时间内解决,这是一个NP-hard问题。
知乎上一个通俗易懂的回答 https://www.zhihu.com/question/27039635