股票系列问题-高维动态规划视角

  |  

摘要: 本文介绍股票系列问题,主线算法是动态规划

【对算法,数学,计算机感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:算法题刷刷
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings


本文介绍股票问题这个系列问题,一共六道题。有动态规划和自动机两种思考方式。本文我们串讲一下这六道题,并且重点讨论高维动态规划的思路。以下是内容总览:

这个股票问题中,从动态规划角度看,基本问题是 122 和 188。


股票问题的高维动态规划视角

股票问题的状态设计和转移都是基于以下两个事实:

  1. 状态有三个:考虑到的位置 i;买卖的次数 j;当前的持股状态 k 构成了 dp[i][j][k]
  2. 在每个状态都有 3 种选择:不操作,买,卖

因此股票问题的动态规划的算法大致如下,根据具体问题的变种进行相应的调整:

1
2
状态
dp[i][k][state] i 是时间,k 是次数,state 是状态机(在某一个位置或者时刻可以选择多种状态)

121. 买卖股票的最佳时机

给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。

你只能选择 某一天 买入这只股票,并选择在 未来的某一个不同的日子 卖出该股票。设计一个算法来计算你所能获取的最大利润。

返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润,返回 0 。

提示:

1
2
1 <= prices.length <= 1e5
0 <= prices[i] <= 1e4

示例 1:
输入:[7,1,5,3,6,4]
输出:5
解释:在第 2 天(股票价格 = 1)的时候买入,在第 5 天(股票价格 = 6)的时候卖出,最大利润 = 6-1 = 5 。
注意利润不能是 7-1 = 6, 因为卖出价格需要大于买入价格;同时,你不能在买入前卖出股票。

示例 2:
输入:prices = [7,6,4,3,1]
输出:0
解释:在这种情况下, 没有交易完成, 所以最大利润为 0。

算法1:贪心

1
2
3
4
外层循环枚举 i: 从 0 开始,直到 n - 2
始终维护一个历史最低价 cur
当前枚举到的价格为 prices[i],为最新的历史最低价 cur = prices[i]
内层循环枚举 j: 从 i + 1 开始,直至 prices[j] < cur 跳出内层循环。没有跳出循环,则当前枚举值比 cur 大,就更新答案。

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
class Solution {
public:
int maxProfit(vector<int>& prices) {
int n = prices.size();
if(n <= 1) return 0;
int result = 0;
int i = 0;
while(i < n - 1)
{
int cur = prices[i];
int j = i + 1;
while(j < n && prices[j] >= cur)
{
if(prices[j] > cur)
result = max(result, prices[j] - cur);
++j;
}
i = j;
}
return result;
}
};

算法2:转换成最大子段和

目标是求数组中两个元素的差,两个点的差可以转换为求和,其思想来源于以下公式。

当 $F(x)$ 离散,a, b 代表数组下标时,结论仍正确,此时 $F(x)$ 表示的数组 F[x] 就是前缀和。这可以理解为前缀和和差分之间的关系。区间和问题与求差问题可以互相转化。

对于本题,要求数组中两个元素的差,可以转化成求其查分数组的区间和。

1
2
先由原始序列 prices(i = 0..n-1) 求差分序列 diff(i = 0..n-2)
然后求 diff 数组的最大子段和

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
class Solution {
public:
int maxProfit(vector<int>& prices) {
int n = prices.size();
if(n <= 1) return 0;
vector<int> diff(n - 1);
for(int i = 0; i < n - 1; ++i)
diff[i] = prices[i + 1] - prices[i];
vector<int> dp(n - 1, 0);
dp[0] = max(0, diff[0]);
for(int i = 1; i < n - 1; ++i)
dp[i] = max(0, dp[i - 1] + diff[i]);
int result = 0;
for(int a: dp) result = max(result, a);
return result;
}
};

算法3: 动态规划

1
2
3
4
5
6
7
8
9
10
11
12
状态定义:
dp[i][j][k] := 考虑前i天,第i天手中有股票和无股票,且操作k次(含买和卖)时手上的现金

初始化:
dp[0][0][0] = 0, dp[0][0][1] = INT_MIN
dp[0][1][0] = INT_MIN, dp[0][1][1] = INT_MIN

转移:
dp[i][0][0] = dp[i - 1][0][0]
dp[i][0][1] = max(dp[i - 1][0][1], dp[i - 1][1][0] + prices[i])
dp[i][1][0] = max(dp[i - 1][1][0], dp[i - 1][0][0] - prices[i])
dp[i][1][1] 不存在

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
class Solution {
public:
int maxProfit(vector<int>& prices) {
int n = prices.size();
if(n <= 1) return 0;
vector<vector<vector<int> > > dp(n, vector<vector<int> >(2, vector<int>(2, 0)));
dp[0][1][0] = -prices[0]; // 买入
for(int i = 1; i < n; ++i)
{
dp[i][0][0] = dp[i - 1][0][0];
dp[i][0][1] = max(dp[i - 1][0][1], dp[i - 1][1][0] + prices[i]);
dp[i][1][0] = max(dp[i - 1][1][0], dp[i - 1][0][0] - prices[i]);
}
return dp[n - 1][0][1];
}
};

122. 买卖股票的最佳时机 II

给你一个整数数组 prices ,其中 prices[i] 表示某支股票第 i 天的价格。

在每一天,你可以决定是否购买和/或出售股票。你在任何时候 最多 只能持有 一股 股票。你也可以先购买,然后在 同一天 出售。

返回 你能获得的 最大 利润 。

示例 1:
输入:prices = [7,1,5,3,6,4]
输出:7
解释:在第 2 天(股票价格 = 1)的时候买入,在第 3 天(股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5 - 1 = 4 。
随后,在第 4 天(股票价格 = 3)的时候买入,在第 5 天(股票价格 = 6)的时候卖出, 这笔交易所能获得利润 = 6 - 3 = 3 。
总利润为 4 + 3 = 7 。

示例 2:
输入:prices = [1,2,3,4,5]
输出:4
解释:在第 1 天(股票价格 = 1)的时候买入,在第 5 天 (股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5 - 1 = 4 。
总利润为 4 。

示例 3:
输入:prices = [7,6,4,3,1]
输出:0
解释:在这种情况下, 交易无法获得正利润,所以不参与交易可以获得最大利润,最大利润为 0 。

提示:

1
2
1 <= prices.length <= 3 * 1e4
0 <= prices[i] <= 1e4

算法1:峰谷类问题,贪心

峰谷类问题:峰谷类问题分类汇总

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
class Solution {
public:
int maxProfit(vector<int>& prices) {
int n = prices.size();
if(n <= 1) return 0;
int result = 0;
int i = 0;
while(i < n - 1)
{
int j = i + 1;
while(j < n && prices[j - 1] <= prices[j])
++j;
result += prices[j - 1] - prices[i];
i = j;
}
return result;
}
};

算法2:动态规划

1
2
3
4
5
6
7
8
9
状态定义:
dp[i][j] := 考虑前i天,第i天手中无股票和有股票时手上的现金

初始化:
dp[0][0] = 0(初始手上现金为0), dp[0][1] = -prices[0]

转移:
dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i])
dp[i][1] = max(dp[i - 1][1], dp[i - 1][0] - prices[i])

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
class Solution {
public:
int maxProfit(vector<int>& prices) {
int n = prices.size();
if(n <= 1) return 0;
vector<vector<int> > dp(n, vector<int>(2, 0));
dp[0][1] = -prices[0];
for(int i = 1; i < n; ++i)
{
dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
dp[i][1] = max(dp[i - 1][1], dp[i - 1][0] - prices[i]);
}
return dp[n - 1][0];
}
};

123. 买卖股票的最佳时机 III

给定一个数组,它的第 i 个元素是一支给定的股票在第 i 天的价格。

设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。

注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。

示例 1:
输入:prices = [3,3,5,0,0,3,1,4]
输出:6
解释:在第 4 天(股票价格 = 0)的时候买入,在第 6 天(股票价格 = 3)的时候卖出,这笔交易所能获得利润 = 3-0 = 3 。
随后,在第 7 天(股票价格 = 1)的时候买入,在第 8 天 (股票价格 = 4)的时候卖出,这笔交易所能获得利润 = 4-1 = 3 。

示例 2:
输入:prices = [1,2,3,4,5]
输出:4
解释:在第 1 天(股票价格 = 1)的时候买入,在第 5 天 (股票价格 = 5)的时候卖出, 这笔交易所能获得利润 = 5-1 = 4 。
注意你不能在第 1 天和第 2 天接连购买股票,之后再将它们卖出。
因为这样属于同时参与了多笔交易,你必须在再次购买前出售掉之前的股票。

示例 3:
输入:prices = [7,6,4,3,1]
输出:0
解释:在这个情况下, 没有交易完成, 所以最大利润为 0。

示例 4:
输入:prices = [1]
输出:0

提示:

1
2
1 <= prices.length <= 1e5
0 <= prices[i] <= 1e5

算法1:贪心 (完全没想到,宝藏算法)

第一次扫描:计算只买卖一次,且第 i 天卖出的最大利益:第 i 天价 - 前 i 天最低价;在扫描的过程中记录前 i 天中只卖 1 次的最大利益 f[i] (不一定是第 i 天卖)。

第二次扫描(枚举第2次交易):从后往前枚举,计算只买卖一次且第 i 天买入的的最大利益:第 i 天后的最高价 - 第 i 天价,这个值再加上 f[i - 1] 就是总收益。

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
class Solution {
public:
int maxProfit(vector<int>& prices) {
int n = prices.size();
if(n <= 1) return 0;
vector<int> f(n, 0);
int lowest = prices[0];
for(int i = 1; i < n; ++i)
{
f[i] = f[i - 1];
if(prices[i] - lowest > 0)
f[i] = max(f[i], prices[i] - lowest);
else
lowest = prices[i];
}
int result = f[n - 1];
int highest = prices[n - 1];
for(int i = n - 2; i >= 1; --i)
{
if(highest - prices[i] > 0)
result = max(result, highest - prices[i] + f[i - 1]);
else
highest = prices[i];

}
return result;
}
};

算法2:动态规划

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
状态定义:
dp[i][j][k] := 考虑到 i,手上状态为 j(0 表示无股票,1 表示有股票),总共交易 k 次时的最大利润(k = 0, 1, 2)

状态转移:
dp[i][0][0] = dp[i - 1][0][0]
dp[i][1][0] = max(dp[i - 1][1][0], dp[i - 1][0][0] - prices[i])
dp[i][0][k] = max(dp[i - 1][0][k], dp[i - 1][1][k - 1] + prices[i]) k > 0
dp[i][1][k] = max(dp[i - 1][1][k], dp[i - 1][0][k] - prices[i]) 0 < k < K

初始化:
dp[0][0][0] = 0
dp[0][1][0] = -prices[0]
dp[0][1][k] = -INF (k > 0)

答案
max dp[n - 1][0][k] (k = 0,1,2)

边界和初始化比较麻烦, 当 K 大时候会 MLE,例如第 188 题属于这个情况。

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
class Solution {
public:
int maxProfit(vector<int>& prices) {
using ll = long long;
int n = prices.size();
if(n <= 1) return 0;
int K = 2;
vector<vector<vector<int> > > dp(n, vector<vector<int> >(2, vector<int>(K + 1, 0)));
dp[0][1][0] = -prices[0];
for(int i = 0; i < n; ++i)
for(int k = 1; k <= K; ++k)
dp[i][1][k] = INT_MIN;
for(int i = 1; i < n; ++i)
{
dp[i][0][0] = dp[i - 1][0][0];
dp[i][1][0] = max((ll)dp[i - 1][1][0], (ll)dp[i - 1][0][0] - prices[i]);
for(int k = 1; k < K; ++k)
{
dp[i][0][k] = max((ll)dp[i - 1][0][k], (ll)dp[i - 1][1][k - 1] + prices[i]);
dp[i][1][k] = max((ll)dp[i - 1][1][k], (ll)dp[i - 1][0][k] - prices[i]);
}
dp[i][0][K] = max((ll)dp[i - 1][0][K], (ll)dp[i - 1][1][K - 1] + prices[i]);
}
int result = 0;
for(int k = 1; k <= K; ++k)
result = max(result, dp[n - 1][0][k]);
return result;
}
};

188. 买卖股票的最佳时机 IV

给定一个整数数组 prices ,它的第 i 个元素 prices[i] 是一支给定的股票在第 i 天的价格,和一个整型 k 。

设计一个算法来计算你所能获取的最大利润。你最多可以完成 k 笔交易。也就是说,你最多可以买 k 次,卖 k 次。

注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。

示例 1:
输入:k = 2, prices = [2,4,1]
输出:2
解释:在第 1 天 (股票价格 = 2) 的时候买入,在第 2 天 (股票价格 = 4) 的时候卖出,这笔交易所能获得利润 = 4-2 = 2 。

示例 2:
输入:k = 2, prices = [3,2,6,5,0,3]
输出:7
解释:在第 2 天 (股票价格 = 2) 的时候买入,在第 3 天 (股票价格 = 6) 的时候卖出, 这笔交易所能获得利润 = 6-2 = 4 。
随后,在第 5 天 (股票价格 = 0) 的时候买入,在第 6 天 (股票价格 = 3) 的时候卖出, 这笔交易所能获得利润 = 3-0 = 3 。

提示:

1
2
3
0 <= k <= 100
0 <= prices.length <= 1000
0 <= prices[i] <= 1000

算法:动态规划

直接套用 123 题的动态规划(123 题),MLE,需要修改,以下代码与 123 题动态规划代码的唯一区别就是与变量 kk 相关的两行。

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
class Solution {
public:
int maxProfit(int kk, vector<int>& prices) {
if(kk == 0) return 0;
using ll = long long;
int n = prices.size();
if(n <= 1) return 0;
int K = kk;
vector<vector<vector<int> > > dp(n, vector<vector<int> >(2, vector<int>(K + 1, 0)));
dp[0][1][0] = -prices[0];
for(int i = 0; i < n; ++i)
for(int k = 1; k <= K; ++k)
dp[i][1][k] = INT_MIN;
for(int i = 1; i < n; ++i)
{
dp[i][0][0] = dp[i - 1][0][0];
dp[i][1][0] = max((ll)dp[i - 1][1][0], (ll)dp[i - 1][0][0] - prices[i]);
for(int k = 1; k < K; ++k)
{
dp[i][0][k] = max((ll)dp[i - 1][0][k], (ll)dp[i - 1][1][k - 1] + prices[i]);
dp[i][1][k] = max((ll)dp[i - 1][1][k], (ll)dp[i - 1][0][k] - prices[i]);
}
dp[i][0][K] = max((ll)dp[i - 1][0][K], (ll)dp[i - 1][1][K - 1] + prices[i]);
}
int result = 0;
for(int k = 1; k <= K; ++k)
result = max(result, dp[n - 1][0][k]);
return result;
}
};

优化

优化的方法就是中间加一步类似于剪枝的操作:因为对于长度为 n 的序列,最多有 $\frac{n}{2}$ 组买卖,因此当 $k > \frac{n}{2}$ 时,相当于买卖不限次是,这就是第 122 题的情况了。

1
2
若 k >= n / 2: 用 122 题的算法(贪心或动态规划)。
若 k < n / 2: 用 123 题即买卖次数限制为 k 的动态规划。

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
class Solution {
public:
int maxProfit(int kk, vector<int>& prices) {
if(kk == 0) return 0;
using ll = long long;
int n = prices.size();
if(n <= 1) return 0;
if(kk >= n / 2) return maxProfit_2(prices);
int K = kk;
vector<vector<vector<int> > > dp(n, vector<vector<int> >(2, vector<int>(K + 1, 0)));
dp[0][1][0] = -prices[0];
for(int i = 0; i < n; ++i)
for(int k = 1; k <= K; ++k)
dp[i][1][k] = INT_MIN;
for(int i = 1; i < n; ++i)
{
dp[i][0][0] = dp[i - 1][0][0];
dp[i][1][0] = max((ll)dp[i - 1][1][0], (ll)dp[i - 1][0][0] - prices[i]);
for(int k = 1; k < K; ++k)
{
dp[i][0][k] = max((ll)dp[i - 1][0][k], (ll)dp[i - 1][1][k - 1] + prices[i]);
dp[i][1][k] = max((ll)dp[i - 1][1][k], (ll)dp[i - 1][0][k] - prices[i]);
}
dp[i][0][K] = max((ll)dp[i - 1][0][K], (ll)dp[i - 1][1][K - 1] + prices[i]);
}
int result = 0;
for(int k = 1; k <= K; ++k)
result = max(result, dp[n - 1][0][k]);
return result;
}

private:
int maxProfit_2(vector<int>& prices) {
int n = prices.size();
if(n <= 1) return 0;
int result = 0;
int i = 0;
while(i < n - 1)
{
int j = i + 1;
while(j < n && prices[j - 1] <= prices[j])
++j;
result += prices[j - 1] - prices[i];
i = j;
}
return result;
}
};

309. 最佳买卖股票时机含冷冻期

给定一个整数数组prices,其中第 prices[i] 表示第 i 天的股票价格 。​

设计一个算法计算出最大利润。在满足以下约束条件下,你可以尽可能地完成更多的交易(多次买卖一支股票):

  • 卖出股票后,你无法在第二天买入股票 (即冷冻期为 1 天)。

注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。

提示:

1
2
1 <= prices.length <= 5000
0 <= prices[i] <= 1000

示例 1:
输入: prices = [1,2,3,0,2]
输出: 3
解释: 对应的交易状态为: [买入, 卖出, 冷冻期, 买入, 卖出]

示例 2:
输入: prices = [1]
输出: 0

算法 (C++)

与 122 题相同,但卖出后,无法在第二天买入(冷冻期1天)。

1
2
3
4
5
6
dp[i][j] := 考虑前i天,第i天手中无股票和有股票时手上的现金
初始化:dp[0][0] = 0(初始手上现金为0), dp[0][1] = -prices[0]
dp[1][0] = max(dp[0][0], dp[0][1] + prices[1])
dp[1][1] = max(dp[0][1], -prices[1])
转移 dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i])
dp[i][1] = max(dp[i - 1][1], dp[i - 2][0] - prices[i])

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
class Solution {
public:
int maxProfit(vector<int>& prices) {
int n = prices.size();
if(n <= 1) return 0;
vector<vector<int> > dp(n, vector<int>(2, 0));
dp[0][1] = -prices[0];
dp[1][0] = max(dp[0][0], dp[0][1] + prices[1]);
dp[1][1] = max(dp[0][1], -prices[1]);
for(int i = 2; i < n; ++i)
{
dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
dp[i][1] = max(dp[i - 1][1], dp[i - 2][0] - prices[i]);
}
return dp[n - 1][0];
}
};

714. 买卖股票的最佳时机含手续费

给定一个整数数组 prices,其中 prices[i]表示第 i 天的股票价格 ;整数 fee 代表了交易股票的手续费用。

你可以无限次地完成交易,但是你每笔交易都需要付手续费。如果你已经购买了一个股票,在卖出它之前你就不能再继续购买股票了。

返回获得利润的最大值。

注意:这里的一笔交易指买入持有并卖出股票的整个过程,每笔交易你只需要为支付一次手续费。

示例 1:
输入:prices = [1, 3, 2, 8, 4, 9], fee = 2
输出:8
解释:能够达到的最大利润:
在此处买入 prices[0] = 1
在此处卖出 prices[3] = 8
在此处买入 prices[4] = 4
在此处卖出 prices[5] = 9
总利润: ((8 - 1) - 2) + ((9 - 4) - 2) = 8

示例 2:
输入:prices = [1,3,7,5,10,3], fee = 3
输出:6

提示:

1
2
3
1 <= prices.length <= 5 * 1e4
1 <= prices[i] < 5 * 1e4
0 <= fee < 5 * 1e4

算法:动态规划

与 122 题相同,但是买卖有一个手续费 fee (买和卖加起来的手续费为 fee)。

1
2
3
4
dp[i][j] := 考虑前i天,第i天手中无股票和有股票时手上的现金
初始化:dp[0][0] = 0(初始手上现金为0), dp[0][1] = -prices[0] - fee
转移 dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i])
dp[i][1] = max(dp[i - 1][1], dp[i - 1][0] - prices[i] - fee)

代码 (C++)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
class Solution {
public:
int maxProfit(vector<int>& prices, int fee) {
int n = prices.size();
if(n <= 1) return 0;
vector<vector<int> > dp(n, vector<int>(2, 0));
dp[0][1] = -prices[0] - fee;
for(int i = 1; i < n; ++i)
{
dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
dp[i][1] = max(dp[i - 1][1], dp[i - 1][0] - prices[i] - fee);
}
return dp[n - 1][0];
}
};

Share