01背包理论

This commit is contained in:
youngyangyang04
2020-12-20 16:11:16 +08:00
parent cf4f84f30b
commit c1269cef51

View File

@ -0,0 +1,358 @@
## 01 背包
有N件物品和一个最多能被重量为W 的背包。第i件物品的重量是weight[i]得到的价值是value[i] 。**每件物品只能用一次**,求解将哪些物品装入背包里物品价值总和最大。
这是标准的背包问题,以至于很多同学看了这个自然就会想到背包,甚至都不知道暴力的解法应该怎么解。
这样其实就是没有从底向上去思考,而是习惯性的只知道背包了,那么暴力的解法应该是怎么样的呢?
每一件物品其实只有两个状态取或者不取所以可以使用回溯法搜索出所有的情况那么时间复杂度就是O(2^n)这里的n表示物品数量。
所以暴力的解法是指数级别的时间复杂度。进而才需要动态规划的解法来进行优化!
目前leetcode上没有发现有纯01背包的题目leetcode上相关01背包问题都是需要某种条件转化为01背包问题所以 我举一个纯01背包的例子来给大家讲解。
把01背包理论和代码理解透彻了我们再刷leetcode上的题目。
下面的讲解中,我举一个例子:
背包最大重量为4。
物品为:
| | 重量 | 价值 |
| --- | --- | --- |
| 物品0 | 1 | 15 |
| 物品1 | 3 | 20 |
| 物品2 | 4 | 30 |
以下讲解和图示中出现的数字都是以这个例子为例。
* 确定dp数组以及下标的含义
对于背包问题,有一种写法, 是使用二维数组,即**dp[i][j] 表示从下标为[0-i]的物品里任意取放进容量为j的背包价值总和最大是多少**。
只看这个二维数组的定义,大家一定会有点懵,看下面这个图:
<img src='../pics/动态规划-背包问题1.png' width=600> </img></div>
**要时刻记着这个dp数组的含义下面的一些步骤都围绕这dp数组的含义进行的**如果哪里看懵了就来回顾一下i代表什么j又代表什么。
* dp数组如何初始化
**关于初始化一定要和dp数组的定义吻合否则到递推公式的时候就会越来越乱**
首先从dp[i][j]的定义触发如果背包容量j为0的话无论是选取哪些物品背包价值总和一定为0。如图
<img src='../pics/动态规划-背包问题2.png' width=600> </img></div>
那么其他下标应该初始化多少呢?
dp[i][j]在推导的时候一定是取价值最大的数如果题目给的价值都是正整数那么非0下标都初始化为0就可以了因为0就是最小的了不会影响去最大价值的结果。
如果题目给的价值有负数那么非0下标就要初始化为负无穷了。例如一个物品的价值是-2但对应的位置依然初始化为0那么去最大值的时候就会取0而不是-2了所以要初始化为负无穷。
这样才能让dp数组在递归公式的过程中取的最大的价值而不是被初始值覆盖了。
而本题价值都是正整数所以初始化为0就可以了。
如图:
<img src='../pics/动态规划-背包问题3.png' width=600> </img></div>
**很明显,红框的位置就是我们要求的结果**
* 确定递推公式
再回顾一下dp[i][j]的含义:从下标为[0-i]的物品里任意取放进容量为j的背包价值总和最大是多少。
那么可以有两个方向推出来dp[i][j]
* 由dp[i - 1][j]推出即背包里不放物品i的最大价值此时dp[i][j]就是dp[i - 1][j]
* 由dp[i - 1][j - weight[i]]推出dp[i - 1][j - weight[i]] 为背包容量为j - weight[i]的时候不放物品i的最大价值那么dp[i - 1][j - weight[i]] + value[i] 物品i的价值就是背包放物品i得到的最大价值
所以递归公式: dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]);
* 确定遍历顺序
确定递归公式之后,还要确定遍历顺序。
在如下图中,可以看出,有两个遍历的维度:物品与背包重量
<img src='../pics/动态规划-背包问题3.png' width=600> </img></div>
那么问题来了,先遍历 物品还是先遍历背包重量呢?
**其实都可以!! 但是先遍历物品更好理解**。下面讲到具体原因的时候来在分析原因。
那么首先遍历物品,然后遍历背包重量。
注意 状态转移方程 dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]); 中有两个下标为负数的情况i - 1 和 j - weight[i]。
既然i 是由 i-1 推导出来那么i为0的时候就一定要初始化i为0存放编号0的物品的时候各个容量的背包所能存放的最大价值。
代码如下:
```
// 倒叙遍历
for (int j = bagWeight; j >= weight[0]; j--) {
dp[0][j] = dp[0][j - weight[0]] + value[0]; // 初始化i为0时候的情况
}
```
**大家应该发现,这个初始化为什么是倒叙的遍历的?正序遍历就不行么?**
正序遍历还真就不行dp[0][j]表示容量为j的背包存放物品0时候的最大价值物品0的价值就是15因为题目中说了**每个物品只有一个!**所以dp[0][j]如果不是初始值的话就应该都是物品0的价值也就是15。
但如果一旦正序遍历了那么物品0就会被重复加入多次 例如代码如下:
```
// 正序遍历
for (int j = weight[0]; j <= bagWeight; j++) {
dp[0][j] = dp[0][j - weight[0]] + value[0];
}
```
例如dp[0][1] 是15到了dp[0][2] = dp[0][2 - 1] + 15; 也就是dp[0][2] = 30 了那么就是物品0被重复放入了。
**所以一定要倒叙遍历保证物品0只被放入一次这一点对01背包很重要后面在讲解滚动数组的时候还会用到倒叙遍历来保证物品使用一次**
初始化dp数组之后就可以先遍历物品在遍历背包然后使用公式推导了代码如下
```
// 遍历过程
for(int i = 1; i < weight.size(); i++) { // 遍历物品
for(int j = 0; j <= bagWeight; j++) { // 遍历背包重量
if (j < weight[i]) dp[i][j] = dp[i - 1][j];
else dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]);
}
}
```
来看一下对应的dp数组的数值如图
<img src='../pics/动态规划-背包问题4.png' width=600> </img></div>
最终结果就是dp[2][4]。
建议大家此时自己在纸上推导一遍看看dp数组里每一个数值是不是这样的。
**做动态规划的题目最好的过程就是自己在纸上举一个例子把对应的dp数组的数值推导一下然后在动手写代码**
很多同学做dp题目遇到各种问题然后凭感觉东改改西改改怎么改都不对或者稀里糊涂就改过了。
主要就是自己没有动手推导一下dp数组的演变过程如果推导明白了代码写出来就算有问题只要把dp数组打印出来对比一下和自己推导的有什么差异很快就可以发现问题了。
遍历过程的代码其实优化的我是为了把dp数组里数值完整表现出来精简一下可以是
```
// 遍历过程
for(int i = 1; i < weight.size(); i++) { // 遍历物品
for(int j = 0; j <= bagWeight; j++) { // 遍历背包重量
dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]);
}
}
```
完整测试代码:
```C++
void 01bagProblem() {
int w[] = {1, 3, 4};
int v[] = {15, 20, 30};
int bagWeight = 4;
vector<int> weight(w, w + sizeof(w)/sizeof(int));
vector<int> value(v, v + sizeof(v)/sizeof(int));
vector<vector<int>> dp(weight.size() + 1, vector<int>(bagWeight + 1, 0));
for (int j = bagWeight; j >= weight[0]; j--) {
dp[0][j] = dp[0][j - weight[0]] + value[0];
}
// weight数组的大小 就是物品个数
for(int i = 1; i < weight.size(); i++) { // 遍历物品
for(int j = 0; j <= bagWeight; j++) { // 遍历背包容量
if (j < weight[i]) dp[i][j] = dp[i - 1][j]; // 这个是为了展现dp数组里元素的变化可以删掉
else dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]);
}
}
// 把dp数组打印出来看看对不对
for (int i = 0 ; i < weight.size(); i++) {
for (int j = 0; j <= bagWeight; j++) {
cout << dp[i][j] << " ";
}
cout << endl;
}
// 输出结果
cout << dp[weight.size() - 1][bagWeight] << endl;
}
```
上面我们讲到 两层for循环的顺序讲解的过程是用先遍历物品在遍历背包。
那么先遍历背包,再遍历物品,也是可以的!
例如这样:
```
// weight数组的大小 就是物品个数
for(int j = 0; j <= bagWeight; j++) { // 遍历背包容量
for(int i = 1; i < weight.size(); i++) { // 遍历物品
if (j < weight[i]) dp[i][j] = dp[i - 1][j];
else dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]);
}
}
```
为什么也是可以的呢?
**要理解递归的本质和递推的方向**。
dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]); 递归公式中可以看出dp[i][j]是靠dp[i-1][j]和dp[i - 1][j - weight[i]]推导出来的。
dp[i-1][j]和dp[i - 1][j - weight[i]] 都在dp[i][j]的左上角方向(包括正左和正上两个方向),那么先遍历物品,在遍历背包的过程如图所示:
<img src='../pics/动态规划-背包问题5.png' width=600> </img></div>
在来看看先遍历背包,再遍历物品呢,如图:
<img src='../pics/动态规划-背包问题6.png' width=600> </img></div>
**大家可以看出虽然两个for循环遍历的次序不同但是dp[i][j]所需要的数据就是左上角根本不影响dp[i][j]公式的推导!**
这一点其实很多题解都没有说清楚此时大家应该对01背包两层for控制两个维度究竟先遍历哪一个有一个深刻理解了。
## 滚动数组
对于背包问题其实状态都是可以压缩的。
在使用二维数组的时候递推公式dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]);
这里其实可以发现如果把dp[i-1]那一层拷贝到dp[i]上表达式完全可以是dp[i][j] = max(dp[i][j], dp[i][j - weight[i]] + value[i]);
读到这里估计大家都忘了 dp[i][j]里的i和j表达的是什么了i是物品j是背包容量一定要时刻记住这里i和j的含义要不然很容易看懵了。
**与其把dp[i-1]这一层拷贝到dp[i]上,不如只用一个一维数组了**。
只用dp[j]!(一维数组,也可以理解是一个滚动数组)
在一维dp数组中dp[j]表示容量为j的背包所背的物品价值可以最大为dp[j]
* 一维dp数组如何初始化
**关于初始化一定要和dp数组的定义吻合否则到递推公式的时候就会越来越乱**。
dp[j]表示容量为j的背包所背的物品价值可以最大为dp[j]那么dp[0]就应该是0因为背包容量为0所背的物品的最大价值就是0。
那么dp数组除了下标0的位置初始为0其他下标应该初始化多少呢
在回顾一下dp数组的含义容量为j的背包所背的物品价值可以最大为dp[j]。
那么dp数组在推导的时候一定是取价值最大的数如果题目给的价值都是正整数那么非0下标都初始化为0就可以了如果题目给的价值有负数那么非0下标就要初始化为负无穷。
**这样才能让dp数组在递归公式的过程中取的最大的价值而不是被初始值覆盖了**。
那么我假设物品价值都是大于0的所以dp数组初始化的时候都初始为0就可以了。
* 一维dp数组的递推公式
dp[j]为 容量为j的背包所背的最大价值那么如何推导dp[j]呢?
dp[j]可以通过dp[j - weight[j]]推导出来dp[j - weight[i]]表示容量为j - weight[i]的背包所背的最大价值。
dp[j - weight[i]] + value[i] 表示 容量为 j - 物品i体积 的背包 加上 物品i的价值。
那么最大的dp[j]可能就是 dp[j - weight[i]] + value[i]。
那么此时dp[j]有两个选择一个是取自己dp[j]一个是取dp[j - weight[i]] + value[i],指定是取最大的,毕竟是求最大价值,
所以递归公式为:
```
dp[j] = max(dp[j], dp[j - weight[i]] + value[i]);
```
可以看出相对于二维dp数组的写法就是把dp[i][j]中i的维度去掉了。
* 一维dp数组遍历顺序
代码如下:
```
for(int i = 0; i < weight.size(); i++) { // 遍历物品
for(int j = bagWeight; j >= weight[i]; j--) { // 遍历背包容量
dp[j] = max(dp[j], dp[j - weight[i]] + value[i]);
}
}
```
**这里大家发现和二维dp的写法中遍历背包的顺序是不一样的**
二维dp遍历的时候背包容量是从小到大而一维dp遍历的时候背包是从大到小。
为什么呢?
**倒叙遍历是为了保证物品i只被放入一次**在上面讲解二维dp遍历第0行的时候已经提到过一次。
举一个例子物品0的重量weight[0] = 1价值value[0] = 15
如果正序遍历
dp[1] = dp[1 - weight[0]] + value[0] = 15
dp[2] = dp[2 - weight[0]] + value[0] = 30
此时dp[2]就已经是30了意味着物品0被放入了两次所以不能正序遍历。
为什么倒叙遍历,就可以保证物品只放入一次呢?
倒叙就是先算dp[2]
dp[2] = dp[2 - weight[0]] + value[0] = 15 dp数组已经都初始化为0
dp[1] = dp[1 - weight[0]] + value[0] = 15
通过这个例子大家应该理解了为什么倒叙遍历可以保证数组只放入一次!
**那么问题又来了为什么二维dp遍历的时候不用倒叙呢**
因为对数二维dpdp[i][j]都是通过上一层即dp[i-1][j]计算而来不用考虑重复计算dp[i][j]的问题!
再来看看两个嵌套for循环的顺序代码中是先遍历物品嵌套遍历背包容量那可不可以先背包容量嵌套遍历物品呢
不可以!
因为一维dp的写法背包容量一定是要倒序遍历原因上面已经讲了如果遍历背包容量放在上一层dp[bagWeight]只会放入一个物品。
一维dp01背包完整测试代码如下
```
void test_1_wei_bag_problem() {
int w[] = {1, 3, 4};
int v[] = {15, 20, 30};
int bagWeight = 4;
vector<int> weight(w, w + sizeof(w)/sizeof(int));
vector<int> value(v, v + sizeof(v)/sizeof(int));
int dp[6] = {0};
for(int i = 0; i < weight.size(); i++) { // 遍历物品
for(int j = bagWeight; j >= weight[i]; j--) { // 遍历背包容量
dp[j] = max(dp[j], dp[j - weight[i]] + value[i]);
}
// 把dp数组打印出来看看对不对
for (int j = 0; j <= bagWeight; j++) {
cout << dp[j] << " ";
}
cout << endl;
}
// 输出结果
cout << dp[bagWeight] << endl;
}
```