本文来自微信公众号:低并发编程 (ID:dibingfa),原文标题:《图解 | 你管这破玩意叫动态规划》,作者:闪客
1
小宇:闪客,我最近在研究动态规划,但感觉就是想不明白,你能不能给我讲讲呀?
闪客:没问题,这个我擅长,你先说说提到动态规划,你最先想到的是什么?
小宇:就什么子问题呀、状态转移方程呀乱七八糟的,哎呀不行不行,我一想到这些脑子又嗡嗡响了。
闪客:你先别急,你先把所有的名词都抛在脑后,听我讲。
小宇:好滴,你说吧。
闪客:小宇我问你,从 1 一直加到 100 等于多少?
1 + 2 + 3 + … + 100 = ?
小宇:5050!
闪客:你这,怎么不按套路出牌呀,你应该说不知道。
小宇:人家高斯早就算出来了,我还装不知道,这也太假了吧。
全剧终…
2
闪客:好吧,那我再给你出一个题。
小宇:行,你说吧,这回我肯定说不知道。
闪客:一个楼梯有 10 级台阶,你从下往上走,每跨一步只能向上迈 1 级或者 2 级台阶,请问一共有多少种走法?
小宇:额,这我真不知道了,我想想哈。
小宇:哦哦我懂了,这道题里由于每一个递推项都需要前两项的支持,所以必须有最开头的两项作为已知,就是你说的 F 1) = 1 和 F 2) = 2。
闪客:没错。
小宇:嗯嗯,感觉这样就推出全部结果了!我写一下程序你看看。
闪客:先别急,由于这道题是一道经典的动态规划题,所以我们以这道题为例子来定义动态规划的三要素,在本题中
F x-1) 和 F x-2) 被称为 F x) 的最优子结构
F x) = F x-1) + F x-2) 叫状态转移方程
F 1) = 1, F 2) = 2 是问题的边界
之后做动态规划问题,只要找好这三个要素就好了。
小宇:哇,升华了诶,逼格瞬间高了不少呢。
闪客:先别说这些废话了,那接下来你看看能不能写出程序,计算出 F 10) 的结果,这才是难点。
小宇:编程的话这似乎是个递归问题,简单!
int getWaysint n) { if n == 1) { return 1; } if n == 2) { return 2; } return getWaysn-1) + getWaysn-2); }
闪客:嗯不错,这样很简洁,但复杂度太高了,是 O 2^n),具体你可以之后想想为什么。现在你看看能不能将复杂度降低。
小宇:我想想看,计算 F 10) 时需要计算 F 9) 和 F 8),而在递归计算 F 9) 时要计算 F 8) 和 F 7),这样 F 8) 在这里重复计算了,浪费了时间。
那么请问,在不得超过背包的承重的情况下,将哪些物品放入背包,可以使得总价值最大?
小宇:明白了,就是我用这个背包最多能装走多少钱的东西。
闪客:是的。
小宇:哎呀不行,我又陷入走楼梯时的遍历思想了。
闪客:没关系,这道题能想出遍历思想,其实也不容易了,你可以先说一下,找找感觉。
小宇:嗯嗯,那就是每个物品都可以有放入背包和不放入背包两种选择。
如果总重量超过了背包承重,那就不算,或者说将价值记为 0,然后将所有情况中价值最大的那个作为结果。
这样的复杂度也很容易得出,就是 O 2^N)
闪客:没错,这个复杂度很高的算法你已经说的很明白了,那接下来你想想看用动态规划思想,能不能解决这个问题。
小宇:好的,你之前说过,动态规划的三要素是最优子结构、状态转移方程和边界
闪客:没错,之前的变量很少所以比较简单,现在变量多了,定义就变得难了起来,我们先来几个定义方便描述。我们将 4 个物品的重量和价值分别表示为:w1,w2,w3,w4,v1,v2,v3,v4。
假如我们用
FW,i)
表示
用载重为 W 的背包,装前 i 件物品的最大价值
那本题其实就是
用载重为 5kg 的背包,装前 4 件物品的最大价值
其实就是求解
F5,4)
你能找到状态转移方程么?
小宇:我想想,单看这个物品 4,有两种可能:
第一种可能:如果选择把它装入背包,那已经得到了 6 元钱。
此时背包剩余载重为 1kg(5kg-4kg),剩余物品是除去物品 4 后的前 3 件物品。
那这部分能获取到的最大价值,相当于
用一个载重为 1kg 的背包,装前 3 件物品的最大价值
哇,那这部分就是
F1,3)
闪客:哈哈,你这自己说着说着就说对啦!
小宇:所以最终,如果选择将物品 4 放入背包,这种情况下,最大价值就等于二者之和。
F1, 3) + 6
我们的目标就是要计算右下角那个值,即背包载重 W = 5 时,选择前 4 件物品放入背包的最大价值 F 5,4)
小宇:哇这个表格好清晰呀,根据上面的公式
F5,4) = max { F1,3) + 6, F5,3) }
那也就是说只要知道 F 1,3) 和 F 5,3) 的值就可以了对吧?
闪客:没错,那你再看看 F 1,3) 怎么计算?
小宇:好的,F 1,3) 此时背包重量为 1,如果选择放第三件物品的话,诶?好像不行,第三件物品根本放不下呀!
闪客:是的,所以这种情况就没必要讨论放第三件物品的情况了,因为根本放不下,因此 F 1,3) 直接就等于 F 1,2),所以只需要知道 F 1,2) 即可。
同理 F 1,2) 也直接等于 F 1,1),因为在背包重量为 1 时第二件物品也放不下。
闪客:小宇你想想看,那 F 1,1) 又等于什么呢?
小宇:显然嘛,现在只有一件物品可以选了,那能放下当然就放咯,所以最大价值就是第一件物品的价值 3,即 F 1,1) = 3
闪客:没错,这样我们就找到了一个边界值,小宇你想想看还有哪些边界值可以直接得出?你写在表格里吧。
小宇:好的,首先第一列表示背包重量为 0 时的情况,那显然什么都装不了,就全都是 0 了。
然后第一行也比较好算,背包重量 >= 1 时可以放下第一件物品,所以最大价值都等于 3
闪客:很好,接下来,就依次把表格的所有项都填出来,自然就可以算出 F 5,4) 啦。
小宇:哇塞,这样看好清晰呀!
闪客:是呀,不过刚刚我们用的都是具体的数字,那我们试着把这个问题抽象化,用一个载重为 W 的背包,装载 N 件物品,每件物品的重量和价值分别用 wi 和 vi 来表示,那刚刚的状态转移方程是什么呢?
小宇:emm,刚刚 F 5,4) = max { F 1,3) + 6, F 5,3) },如果都用变量表示的话,就是
FW,N) =
max { FW-wn, N-1) + vn,FW, N-1) }
闪客:很好,这就是状态转移方程。
F W-wn, N-1) 和 F W, N-1) 就是 F W,N) 的最优子结构。
而刚刚表格中的第一行和第一列,即 F 0,…) 和 F …,1) 就是边界值!
小宇:哇塞我爱你闪客!终于有点理解动态规划的思想了呢!
4
闪客:别高兴太早,虽然过程看着清晰了,但代码写起来还是有难度的,你今天回去就把代码试着实现一下吧。
小宇:好的,保证完成任务。
闪客:快到晚饭时间了,旁边新开了家饺子馆,要不要一块去吃呀?
小宇:哦不了,晚上想利用晚饭时间再去消化消化动态规划的知识,不是还得代码实现呢么,下次吧,
闪客:哦好吧~
后记
本文通过直观演示 01 背包问题的解题思路,简单说明了动态规划思想的算法核心。可能不少人觉得动态规划难在理解,所以花很多时间在理解其思想上。但其实理解核心思想,这一篇文章就够了,更多的是通过不断做题,反过来帮助自己理解动态规划的思想。所以希望读者在读完本文后,和小宇一样,动手将其代码实现,并找来其他变种题目,继续巩固。