文章目录
贪心法
- 贪心技术是一种设计算法的通用策略。
- 贪心技术的基本思想:
- 基于贪心选择准则,每次得到局部最优的选择。
- 希望利用局部最后得到全局最优解。
- 贪心选择性质:局部最优可以得到全局最优。
- 找到正确的贪心选择准则是设计贪心算法的关键。
- 不同的贪心选择准则可以得到不同的结果。
找零问题(change-making problem)
- 给定无限多不同面额的硬币 d 1 > . . . > d m d_1>...>d_m d1>...>dm,对于总额 n n n,如何找到最少的硬币数目?
- 问题:目标函数和约束条件是什么?
例如:
d 1 = 25 c , d 2 = 10 c , d 3 = 5 c , d 4 = 1 c ,而且 n = 48 c d_1=25c,d_2=10c,d_3=5c,d_4=1c,而且n=48c d1=25c,d2=10c,d3=5c,d4=1c,而且n=48c。
但是:
- 对大多数常用的硬币面额都可以得到最优解。
- 对任意硬币面额,有可能不是最优解。
**那咋办呢。**是不是我的想法、我的策略设计的有问题呢?
那到底咋样弄,才能对于所有情况都能得到最优解呢?
我们可以用回溯法。(不是讲贪心吗,咋又说回溯了?——后面再说这个问题)
- **贪婪法:**建议通过一系列步骤来构造问题的解,每一步对目前构造的部分解做一个扩展,直到获得问题的完全解。(完全解,不是最优解)
- 必须满足:可行、局部最优、不可取消。
贪心算法要求
- 可行的:即它必须满足问题的约束。
- 局部最优:它是当前步骤中所有可行选择中最佳的局部选择。
- 不可取消:即选择一旦做出,在算法的后面步骤中就无法改变了。
在每一步中,它要求“贪婪”地选择最佳操作,并希望通过一系列局部的最优选择,能够产生一个整个问题的(全局的)最优解。
基本思想
- 从问题的某一个初始解出发,通过一系列的贪心选择(当前状态下的局部最优选择),逐步逼近给定的目标,尽可能快地求得更好的解。
- 在贪心算法(greedy method)中也采用逐步构造最优解的方法。在每个阶段,都做出一个按某个评价函数最优的决策,该评价函数最优称为贪心准则(greedy criterion)。
- 贪心算法的正确性,就是要证明按贪心准则求得的解是全局最优解。
- 贪心算法不能对所有问题都得到全局最优解。
- 但是对于许多问题,它能够产生全局最优解。如单源最短路径问题,最小生成树问题等。
适合求解问题的特征
- **贪心选择性质:**可通过局部最优(贪心)选择达到全局最优解。
- 通常以自顶向下的方式进行,每次选择后将问题转化为规模更小的子问题。
- 该性质是贪心法使用成功的保障,否则得到的是近优解。
- 最优子结构性质:问题的最优解包含它的子问题的最优解。
- 并不是所有具有最优子结构性质的问题都可以采用贪心策略。
- 往往可以利用最优子结构性质来证明贪心选择性质。
背包问题
- 0-1背包问题
给定n种物品和一个背包。物品i
的重量是
W
i
W_i
Wi,其价值为
V
i
V_i
Vi,背包的容量为C
。应如何选择装入背包的物品,使得装入背包中物品的总价值最大?
- 背包问题
与0-1背包问题类似,所不同的是,在选择物品i
装入背包时,可以选择物品i的一部分,而不一定要全部装入背包,1≤i≤n
。
0/1背包问题
- 已知
- 背包容量C>0
- n个物品,体积 w i > 0 w_i>0 wi>0,价值 p i > 0 f o r i = 1 , . . . , n p_i>0\ for\ i=1,...,n pi>0 for i=1,...,n
- 确定 { 1 , 2 , . . . , n } \{1,2,...,n\} {1,2,...,n}的子集,满足:
m a x ∑ i ∈ A p i , s u b j e c t t o ∑ i ∈ A w i ≤ C max\sum_{i∈A}p_i,subject\ to\ \sum_{i∈A}w_i≤C maxi∈A∑pi,subject to i∈A∑wi≤C
0/1背包问题——贪心法
-
有以下几种贪心选择准则:
- 最大价值优先——先选择最值钱的物品。
- 最小体积优先
- 最大体积优先
- 最大单位价值优先
这四个规则都有一定道理,那我们该选哪种呢?选最大价值优先?选最大单位价值优先?
- 没有一种方法能保证得到最优解
最大价值优先
(lb
是重量单位,上面是价钱)
可见,最大价值优先,放进来的不一定是最优解。
最小体积优先
可见,最小体积优先,放进来的也不一定是最优解。
最大体积优先
可见,最大体积优先得到的也不一定是最优解。
最大单位价值优先
可见,这个也不一定能得到最优解。
分数背包问题
- 对于0/1背包问题,没有最优的贪心算法。
- 分数背包问题:可以将第
i
个物品的一部分放入背包。 - 对于分数背包问题,贪心算法是其不二选择,该算法基于最大单位价值的选择准则。(感觉有点类似于微积分里的微元思想)
- 贪心算法过程:
- 降序排序 v i / w i v_i/w_i vi/wi。
- 根据排序次序增加物品,直到这个物品装完,或是超出背包容量。
- 如果背包没有满,选择下一个物品开始装。
最优解证明
- 证明:
我们首先假设我们有一个最优解 A 1 A_1 A1,那么我们首先找到 A 1 A_1 A1里面平均价值最高的物品 a m a_m am,然后我们将用商品里面平均价值最高的物品 a 1 a_1 a1将 a m a_m am进行全部替换或者部分替换得到解 A 2 A_2 A2,又因为 v 1 w 1 ≥ v m w m \frac{v_1}{w_1}≥\frac{v_m}{w_m} w1v1≥wmvm,所以 A 2 A_2 A2的总价值高于 A 1 A_1 A1的总价值,这与 A 1 A_1 A1是最优解矛盾,于是得到 A 1 A_1 A1里面包含平均价值最高的物品。
- 小数背包问题还具有贪心选择性质,用贪心法求解更简单、更快速。
- 0-1背包问题用贪心法求解不一定能得到最优解。
任务调度问题
- 9个任务需要调度,每个任务运行时间为
3,5,6,10,11,14,15,18,20
- 有三个处理器执行这些任务。
- 贪心准则:先运行时间最长的任务。
这个解决方法不错,但是我们可能还可以有更好的策略。
- 另一种贪心准则:优先运行最短任务
这个方式还不如刚才那个,这个需要花费40分钟。
最优解
折腾半天都不是最好的,那我们看看最优解到底是什么样的,如上图所示。
- 这个解为什么是最优的?
但是,可见,若想得到这样的一种解。你要付出的代价就会很高了。
有必要么,实际解决一个问题来说,这样去搞,可能没这个必要。你找到最优解了之后,最优解固然能够帮你节约时间;但是不要忽视了,你寻找这个最优解也要花时间。你为了找一个最优解去节约那一点点时间,然后你花了大量的时间在寻找到最优解上,得不偿失。
实际上我就用一种贪心策略,去做,就拉倒了。虽然可能不是最优,但是接近最优差不多就行了。
对于一些特殊的问题,贪心算法能直接找出其最优解,能直接获取最优解那当然更好了。
总之贪心算法可能找到的不是最优解,而只是局部最优解;但是它的实现是很简单的,不会耗费太多时间。
同时,我们在贪心,贪的过程中,也可以利用回溯法的思想,对一些没必要继续探讨下去的情况进行剪枝,而没必要全部贪到底、再去排除。也就是贪心法配合回溯法进行使用。
活动选择问题
- 这个就是活动选择问题。
活动选择——贪心法
- 贪心法选择准则:
- 最早开始时间优先
- 最小持续时间优先
- 最早完成时间优先
- 哪个准则更有效?
- 需要证明贪心法的正确性。
最早结束时间优先——最优性证明
**定理:**如果活动 a 1 a_1 a1在所有活动中具有最早结束时间,则最优解中一定包含 a 1 a_1 a1。
证明:
- 令 A A A是最优解, a 1 a_1 a1是贪心法选择的最早结束时间的活动。如果 a 1 ∈ A a_1∈A a1∈A,则定理得证。
- 如果 a 1 ∉ A a_1∉A a1∈/A,我们证明 A ∗ = A − { a } + { a 1 } A^*=A-\{a\}+\{a_1\} A∗=A−{a}+{a1}是另一个包含 a 1 a_1 a1的最优解,而 a a a是 A A A中具有最早结束时间的活动。
- 因为活动的结束时间已排序好, f ( a 1 ) ≤ f ( a ) f(a_1)≤f(a) f(a1)≤f(a)。假设 f ( a 1 ) ≤ s ( a ) f(a_1)≤s(a) f(a1)≤s(a),如果我们把 a 1 a_1 a1加到 A A A,意味着 A A A不是最优的。所以 s ( a ) < f ( a 1 ) s(a)<f(a_1) s(a)<f(a1),并且 a 1 a_1 a1和 a a a重叠。因为 f ( a 1 ) ≤ f ( a ) f(a_1)≤f(a) f(a1)≤f(a),如果我们移除 a a a添加 a 1 a_1 a1,可以得到另一个最优解 A ∗ A^* A∗包含了 a 1 a_1 a1。 A ∗ A^* A∗是最优的,因为 ∣ A ∗ ∣ = ∣ A ∣ |A^*|=|A| ∣A∗∣=∣A∣。
**定理:**贪心子选择一定产生最优解。
证明:
- 令 a 1 a_1 a1是贪心算法选择的活动。
- 令 S ∗ S^* S∗是不与 a 1 a_1 a1重叠的活动子集
S ∗ = { a i ∣ i = 2 , . . . , n a n d s i ≥ f ( a 1 ) } S^*=\{a_i | i=2,...,n\ and\ s_i≥f(a_1)\} S∗={ai∣i=2,...,n and si≥f(a1)}
-
令 B B B是 S ∗ S^* S∗的最优解。
-
从 S ∗ S^* S∗的定义可知, A ∗ = { a 1 } ∪ B A^*=\{a_1\}∪B A∗={a1}∪B是可行的,并且是原问题的解。
-
利用反证法证明 A ∗ A^* A∗是最优解。
-
假设 A ∗ A^* A∗不是最优解,令 A A A是包含 a 1 a_1 a1的最优解,则 ∣ A ∗ ∣ < ∣ A ∣ |A^*|<|A| ∣A∗∣<∣A∣,且 ∣ A − { a 1 } ∣ > ∣ A ∗ − { a 1 } ∣ = ∣ B ∣ |A-\{a_1\}|>|A^*-\{a_1\}|=|B| ∣A−{a1}∣>∣A∗−{a1}∣=∣B∣。
-
但是 A − { a 1 } A-\{a_1\} A−{a1}也是 S ∗ S^* S∗的解,与 B B B是 S ∗ S^* S∗的最优解矛盾。
-
所以 A ∗ A^* A∗一定是原问题的最优解。
Prim算法
- 连通图的一棵生成树是包含图的所有定点的连通无环子图(一棵树)。
- 加权连通图的一棵最小生成树是图的一棵权重最小的生成树。
从某个点出发,首先找和它相邻连接的结点中,权值最小的是谁。是b结点、权值为4,那就把b结点并入进来。接着,再找下一条边,就找和a、b相邻的结点中,权值最小的是哪个边,并且把那个结点并入进来。
总之,可以视作两个集合:一个是已并入最小生成树的结点集合,另一个是还未并入的结点集合。每次找这两个集合之间权值最小的连接(不能形成环)。
问题:
一个图,按照这种方式,找出来的所有的最小生成树是不是都是一样的?
它是一棵树,树的结构是由什么决定的?——我每次的起始点选取不同,它的树根结点不一样,肯定就不一样了。
总结
贪心策略的选择很重要。
贪心在某些情况下是可以拿到最优的,但是很容易得到一个局部最优而非全局最优的解。