股票系列问题-高维动态规划视角

字数统计: 5k字 | 阅读时长: 23分

2020-08-10

摘要: 本文介绍股票系列问题，主线算法是动态规划

【对算法，数学，计算机感兴趣的同学，欢迎关注我哈，阅读更多原创文章】
我的网站：潮汐朝夕的生活实验室
我的公众号：算法题刷刷
我的知乎：潮汐朝夕
我的github：FennelDumplings
我的leetcode：FennelDumplings

本文介绍股票问题这个系列问题，一共六道题。有动态规划和自动机两种思考方式。本文我们串讲一下这六道题，并且重点讨论高维动态规划的思路。以下是内容总览：

这个股票问题中，从动态规划角度看，基本问题是 122 和 188。

股票问题的高维动态规划视角

股票问题的状态设计和转移都是基于以下两个事实：

状态有三个：考虑到的位置 i；买卖的次数 j；当前的持股状态 k 构成了 dp[i][j][k]
在每个状态都有 3 种选择：不操作，买，卖

因此股票问题的动态规划的算法大致如下，根据具体问题的变种进行相应的调整：

1 2	状态 dp[i][k][state] i 是时间，k 是次数，state 是状态机(在某一个位置或者时刻可以选择多种状态)

121. 买卖股票的最佳时机

给定一个数组 prices ，它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。

你只能选择某一天买入这只股票，并选择在未来的某一个不同的日子卖出该股票。设计一个算法来计算你所能获取的最大利润。

返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润，返回 0 。

提示：

1 2	1 <= prices.length <= 1e5 0 <= prices[i] <= 1e4

示例 1：
输入：[7,1,5,3,6,4]
输出：5
解释：在第 2 天（股票价格 = 1）的时候买入，在第 5 天（股票价格 = 6）的时候卖出，最大利润 = 6-1 = 5 。
注意利润不能是 7-1 = 6, 因为卖出价格需要大于买入价格；同时，你不能在买入前卖出股票。

示例 2：
输入：prices = [7,6,4,3,1]
输出：0
解释：在这种情况下, 没有交易完成, 所以最大利润为 0。

算法1：贪心

外层循环枚举 i： 从 0 开始，直到 n - 2
始终维护一个历史最低价 cur
当前枚举到的价格为 prices[i]，为最新的历史最低价 cur = prices[i]
内层循环枚举 j: 从 i + 1 开始，直至 prices[j] < cur 跳出内层循环。没有跳出循环，则当前枚举值比 cur 大，就更新答案。

代码 (C++)

class Solution {
public:
    int maxProfit(vector<int>& prices) {
        int n = prices.size();
        if(n <= 1) return 0;
        int result = 0;
        int i = 0;
        while(i < n - 1)
        {
            int cur = prices[i];
            int j = i + 1;
            while(j < n && prices[j] >= cur)
            {
                if(prices[j] > cur)
                    result = max(result, prices[j] - cur);
                ++j;
            }
            i = j;
        }
        return result;
    }
};

算法2：转换成最大子段和

目标是求数组中两个元素的差，两个点的差可以转换为求和，其思想来源于以下公式。

$\int_{a}^{b} f(x)dx = F(x)\bigg|_{a}^{b} = F(b) - F(a)$

当 $F(x)$ 离散，a, b 代表数组下标时，结论仍正确，此时 $F(x)$ 表示的数组 F[x] 就是前缀和。这可以理解为前缀和和差分之间的关系。区间和问题与求差问题可以互相转化。

对于本题，要求数组中两个元素的差，可以转化成求其查分数组的区间和。

1 2	先由原始序列 prices(i = 0..n-1) 求差分序列 diff(i = 0..n-2) 然后求 diff 数组的最大子段和

代码 (C++)

class Solution {
public:
    int maxProfit(vector<int>& prices) {
        int n = prices.size();
        if(n <= 1) return 0;
        vector<int> diff(n - 1);
        for(int i = 0; i < n - 1; ++i)
            diff[i] = prices[i + 1] - prices[i];
        vector<int> dp(n - 1, 0);
        dp[0] = max(0, diff[0]);
        for(int i = 1; i < n - 1; ++i)
            dp[i] = max(0, dp[i - 1] + diff[i]);
        int result = 0;
        for(int a: dp) result = max(result, a);
        return result;
    }
};

算法3: 动态规划

状态定义：
dp[i][j][k] := 考虑前i天，第i天手中有股票和无股票，且操作k次(含买和卖)时手上的现金

初始化：
dp[0][0][0] = 0, dp[0][0][1] = INT_MIN
dp[0][1][0] = INT_MIN, dp[0][1][1] = INT_MIN

转移：
dp[i][0][0] = dp[i - 1][0][0]
dp[i][0][1] = max(dp[i - 1][0][1], dp[i - 1][1][0] + prices[i])
dp[i][1][0] = max(dp[i - 1][1][0], dp[i - 1][0][0] - prices[i])
dp[i][1][1] 不存在

代码 (C++)

class Solution {
public:
    int maxProfit(vector<int>& prices) {
        int n = prices.size();
        if(n <= 1) return 0;
        vector<vector<vector<int> > > dp(n, vector<vector<int> >(2, vector<int>(2, 0)));
        dp[0][1][0] = -prices[0]; // 买入
        for(int i = 1; i < n; ++i)
        {
            dp[i][0][0] = dp[i - 1][0][0];
            dp[i][0][1] = max(dp[i - 1][0][1], dp[i - 1][1][0] + prices[i]);
            dp[i][1][0] = max(dp[i - 1][1][0], dp[i - 1][0][0] - prices[i]);
        }
        return dp[n - 1][0][1];
    }
};

122. 买卖股票的最佳时机 II

给你一个整数数组 prices ，其中 prices[i] 表示某支股票第 i 天的价格。

在每一天，你可以决定是否购买和/或出售股票。你在任何时候最多只能持有一股股票。你也可以先购买，然后在同一天出售。

返回你能获得的最大利润。

示例 1：
输入：prices = [7,1,5,3,6,4]
输出：7
解释：在第 2 天（股票价格 = 1）的时候买入，在第 3 天（股票价格 = 5）的时候卖出, 这笔交易所能获得利润 = 5 - 1 = 4 。
随后，在第 4 天（股票价格 = 3）的时候买入，在第 5 天（股票价格 = 6）的时候卖出, 这笔交易所能获得利润 = 6 - 3 = 3 。
总利润为 4 + 3 = 7 。

示例 2：
输入：prices = [1,2,3,4,5]
输出：4
解释：在第 1 天（股票价格 = 1）的时候买入，在第 5 天（股票价格 = 5）的时候卖出, 这笔交易所能获得利润 = 5 - 1 = 4 。
总利润为 4 。

示例 3：
输入：prices = [7,6,4,3,1]
输出：0
解释：在这种情况下, 交易无法获得正利润，所以不参与交易可以获得最大利润，最大利润为 0 。

提示：

1 2	1 <= prices.length <= 3 * 1e4 0 <= prices[i] <= 1e4

算法1：峰谷类问题，贪心

峰谷类问题：峰谷类问题分类汇总。

$TotalProfit = \sum\limits_{i}(h[peak_i] - h[valley_{i}])$

代码 (C++)

class Solution {
public:
    int maxProfit(vector<int>& prices) {
        int n = prices.size();
        if(n <= 1) return 0;
        int result = 0;
        int i = 0;
        while(i < n - 1)
        {
            int j = i + 1;
            while(j < n && prices[j - 1] <= prices[j])
                ++j;
            result += prices[j - 1] - prices[i];
            i = j;
        }
        return result;
    }
};

算法2：动态规划

状态定义：
dp[i][j] := 考虑前i天，第i天手中无股票和有股票时手上的现金

初始化：
dp[0][0] = 0(初始手上现金为0), dp[0][1] = -prices[0] 

转移：
dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i])
dp[i][1] = max(dp[i - 1][1], dp[i - 1][0] - prices[i])

代码 (C++)

class Solution {
    public:
    int maxProfit(vector<int>& prices) {
        int n = prices.size();
        if(n <= 1) return 0;
        vector<vector<int> > dp(n, vector<int>(2, 0));
        dp[0][1] = -prices[0];
        for(int i = 1; i < n; ++i)
        {
            dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
            dp[i][1] = max(dp[i - 1][1], dp[i - 1][0] - prices[i]);
        }
        return dp[n - 1][0];
    }
};

123. 买卖股票的最佳时机 III

给定一个数组，它的第 i 个元素是一支给定的股票在第 i 天的价格。

设计一个算法来计算你所能获取的最大利润。你最多可以完成两笔交易。

注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。

示例 1:
输入：prices = [3,3,5,0,0,3,1,4]
输出：6
解释：在第 4 天（股票价格 = 0）的时候买入，在第 6 天（股票价格 = 3）的时候卖出，这笔交易所能获得利润 = 3-0 = 3 。
随后，在第 7 天（股票价格 = 1）的时候买入，在第 8 天（股票价格 = 4）的时候卖出，这笔交易所能获得利润 = 4-1 = 3 。

示例 2：
输入：prices = [1,2,3,4,5]
输出：4
解释：在第 1 天（股票价格 = 1）的时候买入，在第 5 天（股票价格 = 5）的时候卖出, 这笔交易所能获得利润 = 5-1 = 4 。
注意你不能在第 1 天和第 2 天接连购买股票，之后再将它们卖出。
因为这样属于同时参与了多笔交易，你必须在再次购买前出售掉之前的股票。

示例 3：
输入：prices = [7,6,4,3,1]
输出：0
解释：在这个情况下, 没有交易完成, 所以最大利润为 0。

示例 4：
输入：prices = [1]
输出：0

提示：

1 2	1 <= prices.length <= 1e5 0 <= prices[i] <= 1e5

算法1：贪心 (完全没想到，宝藏算法)

第一次扫描：计算只买卖一次，且第 i 天卖出的最大利益：第 i 天价 - 前 i 天最低价；在扫描的过程中记录前 i 天中只卖 1 次的最大利益 f[i] (不一定是第 i 天卖)。

第二次扫描(枚举第2次交易)：从后往前枚举，计算只买卖一次且第 i 天买入的的最大利益：第 i 天后的最高价 - 第 i 天价，这个值再加上 f[i - 1] 就是总收益。

代码 (C++)

class Solution {
public:
    int maxProfit(vector<int>& prices) {
        int n = prices.size();
        if(n <= 1) return 0;
        vector<int> f(n, 0);
        int lowest = prices[0];
        for(int i = 1; i < n; ++i)
        {
            f[i] = f[i - 1];
            if(prices[i] - lowest > 0)
                f[i] = max(f[i], prices[i] - lowest);
            else
                lowest = prices[i];
        }
        int result = f[n - 1];
        int highest = prices[n - 1];
        for(int i = n - 2; i >= 1; --i)
        {
            if(highest - prices[i] > 0)
                result = max(result, highest - prices[i] + f[i - 1]);
            else
                highest = prices[i];

        }
        return result;
    }
};

算法2：动态规划

状态定义：
dp[i][j][k] := 考虑到 i，手上状态为 j(0 表示无股票，1 表示有股票)，总共交易 k 次时的最大利润(k = 0, 1, 2)

状态转移：
dp[i][0][0] = dp[i - 1][0][0]
dp[i][1][0] = max(dp[i - 1][1][0], dp[i - 1][0][0] - prices[i])
dp[i][0][k] = max(dp[i - 1][0][k], dp[i - 1][1][k - 1] + prices[i])  k > 0
dp[i][1][k] = max(dp[i - 1][1][k], dp[i - 1][0][k] - prices[i]) 0 < k < K

初始化：
dp[0][0][0] = 0
dp[0][1][0] = -prices[0]
dp[0][1][k] = -INF (k > 0)

答案
max dp[n - 1][0][k]  (k = 0,1,2)

边界和初始化比较麻烦, 当 K 大时候会 MLE，例如第 188 题属于这个情况。

代码 (C++)

class Solution {
public:
    int maxProfit(vector<int>& prices) {
        using ll = long long;
        int n = prices.size();
        if(n <= 1) return 0;
        int K = 2;
        vector<vector<vector<int> > > dp(n, vector<vector<int> >(2, vector<int>(K + 1, 0)));
        dp[0][1][0] = -prices[0];
        for(int i = 0; i < n; ++i)
            for(int k = 1; k <= K; ++k)
                dp[i][1][k] = INT_MIN;
        for(int i = 1; i < n; ++i)
        {
            dp[i][0][0] = dp[i - 1][0][0];
            dp[i][1][0] = max((ll)dp[i - 1][1][0], (ll)dp[i - 1][0][0] - prices[i]);
            for(int k = 1; k < K; ++k)
            {
                dp[i][0][k] = max((ll)dp[i - 1][0][k], (ll)dp[i - 1][1][k - 1] + prices[i]);
                dp[i][1][k] = max((ll)dp[i - 1][1][k], (ll)dp[i - 1][0][k] - prices[i]);
            }
            dp[i][0][K] = max((ll)dp[i - 1][0][K], (ll)dp[i - 1][1][K - 1] + prices[i]);
        }
        int result = 0;
        for(int k = 1; k <= K; ++k)
            result = max(result, dp[n - 1][0][k]);
        return result;
    }
};

188. 买卖股票的最佳时机 IV

给定一个整数数组 prices ，它的第 i 个元素 prices[i] 是一支给定的股票在第 i 天的价格，和一个整型 k 。

设计一个算法来计算你所能获取的最大利润。你最多可以完成 k 笔交易。也就是说，你最多可以买 k 次，卖 k 次。

注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。

示例 1：
输入：k = 2, prices = [2,4,1]
输出：2
解释：在第 1 天 (股票价格 = 2) 的时候买入，在第 2 天 (股票价格 = 4) 的时候卖出，这笔交易所能获得利润 = 4-2 = 2 。

示例 2：
输入：k = 2, prices = [3,2,6,5,0,3]
输出：7
解释：在第 2 天 (股票价格 = 2) 的时候买入，在第 3 天 (股票价格 = 6) 的时候卖出, 这笔交易所能获得利润 = 6-2 = 4 。
随后，在第 5 天 (股票价格 = 0) 的时候买入，在第 6 天 (股票价格 = 3) 的时候卖出, 这笔交易所能获得利润 = 3-0 = 3 。

提示：

1
2
3

0 <= k <= 100
0 <= prices.length <= 1000
0 <= prices[i] <= 1000

算法：动态规划

直接套用 123 题的动态规划(123 题)，MLE，需要修改，以下代码与 123 题动态规划代码的唯一区别就是与变量 kk 相关的两行。

代码 (C++)

class Solution {
public:
    int maxProfit(int kk, vector<int>& prices) {
        if(kk == 0) return 0;
        using ll = long long;
        int n = prices.size();
        if(n <= 1) return 0;
        int K = kk;
        vector<vector<vector<int> > > dp(n, vector<vector<int> >(2, vector<int>(K + 1, 0)));
        dp[0][1][0] = -prices[0];
        for(int i = 0; i < n; ++i)
            for(int k = 1; k <= K; ++k)
                dp[i][1][k] = INT_MIN;
        for(int i = 1; i < n; ++i)
        {
            dp[i][0][0] = dp[i - 1][0][0];
            dp[i][1][0] = max((ll)dp[i - 1][1][0], (ll)dp[i - 1][0][0] - prices[i]);
            for(int k = 1; k < K; ++k)
            {
                dp[i][0][k] = max((ll)dp[i - 1][0][k], (ll)dp[i - 1][1][k - 1] + prices[i]);
                dp[i][1][k] = max((ll)dp[i - 1][1][k], (ll)dp[i - 1][0][k] - prices[i]);
            }
            dp[i][0][K] = max((ll)dp[i - 1][0][K], (ll)dp[i - 1][1][K - 1] + prices[i]);
        }
        int result = 0;
        for(int k = 1; k <= K; ++k)
            result = max(result, dp[n - 1][0][k]);
        return result;
    }
};

优化

优化的方法就是中间加一步类似于剪枝的操作：因为对于长度为 n 的序列，最多有 $\frac{n}{2}$ 组买卖，因此当 $k > \frac{n}{2}$ 时，相当于买卖不限次是，这就是第 122 题的情况了。

1 2	若 k >= n / 2: 用 122 题的算法(贪心或动态规划)。若 k < n / 2: 用 123 题即买卖次数限制为 k 的动态规划。

代码 (C++)

class Solution {
public:
    int maxProfit(int kk, vector<int>& prices) {
        if(kk == 0) return 0;
        using ll = long long;
        int n = prices.size();
        if(n <= 1) return 0;
        if(kk >= n / 2) return maxProfit_2(prices);
        int K = kk;
        vector<vector<vector<int> > > dp(n, vector<vector<int> >(2, vector<int>(K + 1, 0)));
        dp[0][1][0] = -prices[0];
        for(int i = 0; i < n; ++i)
            for(int k = 1; k <= K; ++k)
                dp[i][1][k] = INT_MIN;
        for(int i = 1; i < n; ++i)
        {
            dp[i][0][0] = dp[i - 1][0][0];
            dp[i][1][0] = max((ll)dp[i - 1][1][0], (ll)dp[i - 1][0][0] - prices[i]);
            for(int k = 1; k < K; ++k)
            {
                dp[i][0][k] = max((ll)dp[i - 1][0][k], (ll)dp[i - 1][1][k - 1] + prices[i]);
                dp[i][1][k] = max((ll)dp[i - 1][1][k], (ll)dp[i - 1][0][k] - prices[i]);
            }
            dp[i][0][K] = max((ll)dp[i - 1][0][K], (ll)dp[i - 1][1][K - 1] + prices[i]);
        }
        int result = 0;
        for(int k = 1; k <= K; ++k)
            result = max(result, dp[n - 1][0][k]);
        return result;
    }

private:
    int maxProfit_2(vector<int>& prices) {
        int n = prices.size();
        if(n <= 1) return 0;
        int result = 0;
        int i = 0;
        while(i < n - 1)
        {
            int j = i + 1;
            while(j < n && prices[j - 1] <= prices[j])
                ++j;
            result += prices[j - 1] - prices[i];
            i = j;
        }
        return result;
    }
};

309. 最佳买卖股票时机含冷冻期

给定一个整数数组prices，其中第 prices[i] 表示第 i 天的股票价格。

设计一个算法计算出最大利润。在满足以下约束条件下，你可以尽可能地完成更多的交易（多次买卖一支股票）:

卖出股票后，你无法在第二天买入股票 (即冷冻期为 1 天)。

注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。

提示：

1 2	1 <= prices.length <= 5000 0 <= prices[i] <= 1000

示例 1:
输入: prices = [1,2,3,0,2]
输出: 3
解释: 对应的交易状态为: [买入, 卖出, 冷冻期, 买入, 卖出]

示例 2:
输入: prices = [1]
输出: 0

算法 (C++)

与 122 题相同，但卖出后，无法在第二天买入(冷冻期1天)。

dp[i][j] := 考虑前i天，第i天手中无股票和有股票时手上的现金
初始化：dp[0][0] = 0(初始手上现金为0), dp[0][1] = -prices[0]
        dp[1][0] = max(dp[0][0], dp[0][1] + prices[1])
        dp[1][1] = max(dp[0][1], -prices[1])
转移 dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i])
     dp[i][1] = max(dp[i - 1][1], dp[i - 2][0] - prices[i])

代码 (C++)

class Solution {
    public:
    int maxProfit(vector<int>& prices) {
        int n = prices.size();
        if(n <= 1) return 0;
        vector<vector<int> > dp(n, vector<int>(2, 0));
        dp[0][1] = -prices[0];
        dp[1][0] = max(dp[0][0], dp[0][1] + prices[1]);
        dp[1][1] = max(dp[0][1], -prices[1]);
        for(int i = 2; i < n; ++i)
        {
            dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
            dp[i][1] = max(dp[i - 1][1], dp[i - 2][0] - prices[i]);
        }
        return dp[n - 1][0];
    }
};

714. 买卖股票的最佳时机含手续费

给定一个整数数组 prices，其中 prices[i]表示第 i 天的股票价格；整数 fee 代表了交易股票的手续费用。

你可以无限次地完成交易，但是你每笔交易都需要付手续费。如果你已经购买了一个股票，在卖出它之前你就不能再继续购买股票了。

返回获得利润的最大值。

注意：这里的一笔交易指买入持有并卖出股票的整个过程，每笔交易你只需要为支付一次手续费。

示例 1：
输入：prices = [1, 3, 2, 8, 4, 9], fee = 2
输出：8
解释：能够达到的最大利润:
在此处买入 prices[0] = 1
在此处卖出 prices[3] = 8
在此处买入 prices[4] = 4
在此处卖出 prices[5] = 9
总利润: ((8 - 1) - 2) + ((9 - 4) - 2) = 8

示例 2：
输入：prices = [1,3,7,5,10,3], fee = 3
输出：6

提示：

1
2
3

1 <= prices.length <= 5 * 1e4
1 <= prices[i] < 5 * 1e4
0 <= fee < 5 * 1e4

算法：动态规划

与 122 题相同，但是买卖有一个手续费 fee (买和卖加起来的手续费为 fee)。

dp[i][j] := 考虑前i天，第i天手中无股票和有股票时手上的现金
初始化：dp[0][0] = 0(初始手上现金为0), dp[0][1] = -prices[0] - fee 
转移 dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i])
     dp[i][1] = max(dp[i - 1][1], dp[i - 1][0] - prices[i] - fee)

代码 (C++)

class Solution {
    public:
    int maxProfit(vector<int>& prices, int fee) {
        int n = prices.size();
        if(n <= 1) return 0;
        vector<vector<int> > dp(n, vector<int>(2, 0));
        dp[0][1] = -prices[0] - fee;
        for(int i = 1; i < n; ++i)
        {
            dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] + prices[i]);
            dp[i][1] = max(dp[i - 1][1], dp[i - 1][0] - prices[i] - fee);
        }
        return dp[n - 1][0];
    }
};

潮汐朝夕的生活实验室 \Doge 陪伴一个算法工程师的职业生涯

算法动态规划

股票系列问题-高维动态规划视角

股票问题的高维动态规划视角

121. 买卖股票的最佳时机

算法1：贪心

代码 (C++)

算法2：转换成最大子段和

代码 (C++)

算法3: 动态规划

代码 (C++)

122. 买卖股票的最佳时机 II

算法1：峰谷类问题，贪心

代码 (C++)

算法2：动态规划

代码 (C++)

123. 买卖股票的最佳时机 III

算法1：贪心 (完全没想到，宝藏算法)

代码 (C++)

算法2：动态规划

代码 (C++)

188. 买卖股票的最佳时机 IV

算法：动态规划

代码 (C++)

优化

代码 (C++)

309. 最佳买卖股票时机含冷冻期

算法 (C++)

代码 (C++)

714. 买卖股票的最佳时机含手续费

算法：动态规划

代码 (C++)