目前方法超时,正在思考如何剪枝优化
一开始,我想的是暴力做法, 穷举所有情况,四层循环,
class Solution1 {
public:
int maxSumSubmatrix(vector<vector<int>>& matrix, int k) {
int rows = matrix.size();
int cols = matrix[0].size();
int res = -INT_MAX;
for (int i = 0 ; i < rows; i++){
for (int j = i ; j < rows; j++){
for (int m = 0; m < cols; m++){
for (int n = m; n < cols; n++){
int total = calcSums(matrix, i, j, m, n);
if ( total == k) return k;
if ( total < k) res = max(res, total);
}
}
}
}
return res;
}
int calcSums(vector<vector<int>>& matrix, int i, int j, int m, int n){
int total = 0;
for (int rs = i; rs <= j; rs++){
for (int cs = m; cs <= n; cs++){
total += matrix[rs][cs];
}
}
return total;
}
};
当然肯定会超时,本地运行发现要6.7s。
因为发现有很多子问题被重复计算,因此想到了用动态规划
影响结果的有4个变量,行起始,行结束,列起始,列结束,因此通过4个变量来定义状态
DP[i][j[m][n], 表示从i..j, m..n的和
DP[0][2][0][2], 表示从0-2行,0-2列区域的和
接着状态转移方程
if i == j && m == n: //即固定行固定列
DP[i][j][m][n] = matrix[i][m]
else if i == j && m != n: //固定行, 向下移动列
DP[i][j][m][n] = DP[i][j][m][n-1] + matrix[i][n]
else if i!=j && m == n: //固定列, 向右移动行
DP[i][j][m][n] = DP[i][j-1][m][n] + matrix[j][m]
else: //沿对角线往下移动
DP[i][j][m][n] = DP[i][j-1][m][n] + DP[i][j][m][n-1] - DP[i][j-1][m][n-1] + matrix[j][n];
前三种情况都比较好理解,第四种情况需要看图
对应关系为
- DP[i][j-1][m][n] 对应图中1
- DP[i][j][m][n-1] 对应图中2
- DP[i][j-1][m][n-1] 对应图中3
四维数组在stack分配内存,直接stack overflow了。于是用了容器。
class Solution2 {
public:
int maxSumSubmatrix(vector<vector<int>>& matrix, int k) {
int rows = matrix.size();
if (rows == 0 ) return 0;
int cols = matrix[0].size();
if (cols == 0 ) return 0;
// 状态数组
//int DP[rows][rows][cols][cols]; // stack-overflow, 爆栈了
// 在heap上分配
vector < vector < vector<vector<int>> > > DP(rows, vector<vector<vector<int>>>( rows, vector<vector<int>> (cols, vector<int>(cols, 0) ) ) );
int res = INT_MIN;
for (int i = 0 ; i < rows; i++){
for (int j = i ; j < rows; j++){
for (int m = 0; m < cols; m++){
for (int n = m; n < cols; n++){
if (i == j && m == n){
DP[i][j][m][n] = matrix[i][m];
} else if ( i == j && m != n){
DP[i][j][m][n] = DP[i][j][m][n-1] + matrix[i][n];
} else if ( i != j && m == n){
DP[i][j][m][n] = DP[i][j-1][m][n] + matrix[j][m];
} else {
DP[i][j][m][n] = DP[i][j-1][m][n] + DP[i][j][m][n-1] - DP[i][j-1][m][n-1] + matrix[j][n];
}
if (DP[i][j][m][n] == k) return k;
if (DP[i][j][m][n] < k) {
res = max(DP[i][j][m][n], res);
}
}
}
}
}
return res;
}
};
这个代码运行超时,本地运行100行100列的话大概要0.6秒,倒是比暴力快了十倍。
原本用的的下面方法分配内存,结果扩容时间太久,所以实际代码就是4层嵌套直接分配内存。
vector < vector < vector<vector<int>> > > DP;
DP.resize( rows );
for(int i=0; i < rows; i++){
DP[i].resize(rows);
for (int j = 0; j < rows; j++){
DP[i][j].resize(cols);
for (int k = 0; k < cols; k++){
DP[i][j][k].resize(cols,0);
}
}
}
看到了C++矩阵暴力求解, 发现里面的方法和我之前的想法差不多,于是参考了的思想修改了我之前的代码。
我们不再用四维矩阵进行定义状态,而是只用2个维度。
DP[i][j]定义的是 从0..i, 0..j的和
根据下图
我们的动态转移方程为: DP[i][j] = DP[i-1][j] + DP[i][j-1] - DP[i-1][j-1] + matrix[i][j]
如果我们要求解的区域是 i1..i2, j1..j2, 表示从i1到i2, j1到j2的数组之和,从下图中
我们发现要求解DP[i1..i2][j1..j2] ,对应5
- DP[i2][j2] 是最外圈,也就是1
- DP[i1][i2] 是最内圈,也就是4
- DP[i2][j1] 是3,在上侧。
- DP[i1][j2] 是2,在左侧
不难得到 DP[i1..i2][j1..j2] = DP[i2][j2] - DP[i2][j1] - DP[i1][j2] + DP[i1][j1];
也就是最外圈减去左侧,减去上侧加上多减的部分就是我们计算的区域。
代码如下
class Solution {
public:
int maxSumSubmatrix(vector<vector<int>>& matrix, int k) {
int rows = matrix.size();
if (rows == 0 ) return 0;
int cols = matrix[0].size();
if (cols == 0 ) return 0;
int res = -INT_MAX;
int DP[rows+1][cols+1];
for (int i = 0; i < rows + 1; i++){
DP[i][0] = 0;
}
for (int j = 0; j < cols + 1; j++){
DP[0][j] = 0;
}
for (int i = 1 ; i < rows + 1; i++){
for (int j = 1 ; j < cols + 1; j++){
DP[i][j] = DP[i-1][j] + DP[i][j-1] - DP[i-1][j-1] + matrix[i-1][j-1];
//printf("%d-%d:%d\n", i, j, DP[i][j]);
}
}
for (int i1 = 0 ; i1 < rows; i1++){
for (int i2 = i1+1 ; i2 <= rows; i2++){
for (int j1 = 0; j1 < cols; j1++){
for (int j2 = j1+1; j2 <= cols; j2++){
int total = DP[i2][j2] - DP[i2][j1] - DP[i1][j2] + DP[i1][j1];
//printf("%d.%d.%d.%d: %d\n",i1,i2,j1,j2,total);
if (total == k) return total;
if ( total <k ) res = max(total,res);
}
}
}
}
return res;
}
};
代码中,我用的是一个 rows + 1 X cols + 1 。对应上图中外面的0,1,2,3,4,5,6, 求解0-1的面积,就用1-0来算。