动态规划入门（一）：股票买卖系列问题-CFANZ编程社区

1 本文内容

动态规划专题，通过股票买卖问题学习一维、二维的动态规划算法以及滚动数组的空间优化。
leetcode 121. 买卖股票的最佳时机【easy】
leetcode 122. 买卖股票的最佳时机 II【medium】
leetcode 123. 买卖股票的最佳时机 III【hard】
leetcode 188. 买卖股票的最佳时机 IV【hard】
leetcode 309. 最佳买卖股票时机含冷冻期【medium】
leetcode 714. 买卖股票的最佳时机含手续费【medium】

2 买卖股票的最佳时机

2.1 题目描述

给定一个数组 prices ，它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。

你只能选择某一天买入这只股票，并选择在未来的某一个不同的日子卖出该股票。设计一个算法来计算你所能获取的最大利润。

返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润，返回 0 。

2.2 示例

输入：[7,1,5,3,6,4]

输出：5

输入：prices = [7,6,4,3,1]

输出：0

2.3 容易理解的动态规划解法

首先提炼题信息（1）我们从始至终只能进行一次交易；（2）只有买入和卖出两种操作可以改变我们的的利润。

分析上述信息我们发现：（1）从始至终只存在三种状态：未进行过股票交易、买入且持有股票、买入且但未持有股票（已经卖出）。（2）第i天处于何种状态及获得怎样的收益只取决于第i - 1天的状态和收益。

假设buy[i]表示第i天进入买入且持有股票状态能够取得的最大利润；sell[i]表示第i天进入买入但未持有股票（已经卖出）状态 能够取得的最大利润。

可以得到状态转移方程（1）： $b u y [i] = M a t h . m a x (b u y [i - 1], 0 - p r i c e s [i])$
因为第i天处于买入且持有股票状态有两种情况，要么是第i - 1 天就已经处于该状态，所以利润不变；要么就是第i - 1天之前都未进行过股票交易，在第i天进行了买入操作，则利润为 0 - prices[i]。

也可以得到状态转移方程（2）： $s e l l [i] = M a t h . m a x (s e l l [i - 1], b u y [i - 1] + p r i c e s [i])$
因为第i天处于买入但未持有股票（已经卖出）状态有两种情况，要么是第i - 1 天就已经处于该状态，所以利润变；要么之前处于买入且持有股票状态，今天进行卖出。

买卖股票的最佳时机

所以有：

class Solution {
    public int maxProfit(int[] prices) {
        int[] sell = new int[prices.length];
        int[] buy = new int[prices.length];
        buy[0] = - prices[0];
        for(int i = 1; i < prices.length; i++){
            buy[i] = Math.max(buy[i - 1], 0 - prices[i]);
            sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i]);
        }
        return sell[prices.length - 1];
    }
}

最后返回sell[prices.length - 1];是因为获取最大利润的情况必然是股票已经卖出的状态。

2.4 空间优化的动态规划解法

上面我们已经分析过，第i天处于何种状态及获得怎样的收益只取决于第i - 1天的状态和收益，因此我们不需要记录除i - 1和i以外的任何一天的状态。以此可以将两个数组优化为四个常量：sellPrev, sellCur, buyPrev, sellCur。

解答为：

class Solution {
    public int maxProfit(int[] prices) {
        int buyPrev = -prices[0], sellPrev = 0;
        int buyCur = 0, sellCur = 0;
        for(int i = 1; i < prices.length; i++){
            buyCur = Math.max(buyPrev, - prices[i]);
            sellCur = Math.max(sellPrev, buyPrev + prices[i]);
            buyPrev = buyCur;
            sellPrev = sellCur;    
        }
        return sellCur;
    }
}

2.5 性能分析

两种动态规划解法只进行了规模为prices.length的单层for循环迭代，因此时间复杂度都是O(n)。
第一种解法开了2个大小为prices.length的数组，因此空间复杂度为O(n);第二种解法将空间优化为常量，因此空间复杂度为O（1）。

3 买卖股票的最佳时机 II

3.1 题目描述

给定一个数组 prices ，其中 prices[i] 是一支给定股票第 i 天的价格。

设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易（多次买卖一支股票）。

注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。

3.2 示例

输入: prices = [7,1,5,3,6,4]

输出: 7

输入: prices = [1,2,3,4,5]

输出: 4

3.3 分析与解答

与上一题的区别只有一个，本题可以进行无限次交易而上一题只能进行一次交易。

也就是说，上一题得到的分析结论仍然成立：（1）从始至终只存在三种状态：未进行过股票交易、买入且持有股票、买入且但未持有股票（已经卖出）。（2）第i天处于何种状态及获得怎样的收益只取决于第i - 1天的状态和收益。

买卖股票的最佳时机无限次

不同在于：当第i天处于买入且持有股票状态时这里有三种情况，第一种是第i - 1 天就已经处于该状态，所以利润不变；第二种是第i - 1天处于买入且但未持有股票（已经卖出）的状态，在第i天进行了买入操作，则利润为 sell[i - 1] - prices[i]；第三种是第i - 1天之前都未进行过股票交易，在第i天进行了买入操作，则利润为 0 - prices[i]。但显然，第二种得到的利润一定会比第三种高，所以在计算时可以忽略该状态。

因此状态转移方程（1）发生了改变： $b u y [i] = M a t h . m a x (b u y [i - 1], s e l l [i - 1] - p r i c e s [i])$

根据状态转移方程解答如下：

class Solution {
    public int maxProfit(int[] prices) {
        int[] buy = new int[prices.length];
        int[] sell = new int[prices.length];
        buy[0] = -prices[0];
        for(int i = 1; i < prices.length; i++){
            buy[i] = Math.max(buy[i - 1], sell[i - 1] - prices[i]);
            sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i]);
        }
        return sell[prices.length - 1];
    }
}

3.4 空间优化

经过分析，状态转移方程只有一点点改变，因此很容易得出类似的空间优化版本。

class Solution {
    public int maxProfit(int[] prices) {
        int buyPrev = -prices[0], sellPrev = 0;
        int buyCur = 0, sellCur = 0;
        for(int i = 1; i < prices.length; i++){
            buyCur = Math.max(buyPrev, sellPrev - prices[i]);
            sellCur = Math.max(sellPrev, buyPrev + prices[i]);
            buyPrev = buyCur;
            sellPrev = sellCur;
        }
        return sellCur;
    }
}

3.5 性能分析

类似地：时间复杂度都是O(n)。

法一空间复杂度为O(n)；法二空间复杂度为O（1）。

4 买卖股票的最佳时机 III

4.1 题目描述

给定一个数组，它的第 i 个元素是一支给定的股票在第 i 天的价格。

设计一个算法来计算你所能获取的最大利润。你最多可以完成两笔交易。

注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。

4.2 示例

输入：prices = [3,3,5,0,0,3,1,4]

输出：6

输入：prices = [1,2,3,4,5]

输出：4

4.3 分析与解答

限制最多交易两次使得情况更加的复杂，之前无限制交易或限制一次交易我们都可以简单地将状态分为三种：未进行过股票交易、买入且持有股票、买入且但未持有股票（已经卖出）。而这里不得不将状态分为五种：
状态(1)未进行过股票交易、状态(2)第一次买入且持有股票、状态(3)第一次买入但未持有股票(已经卖出)、状态(4)第二次买入且持有股票、(5)第二次买入但未持有股票(已经卖出)

买卖股票的最佳时机限2次

这里我们也不去管状态(1)。假设firstBuy[i]表示第i天进入状态(2)第一次买入且持有股票能够取得的最大利润；fistSell[i]表示第i天进入状态(3)第一次买入但未持有股票(已经卖出)能够取得的最大利润；seondBuy[i]表示第i天进入状态(4)第一次买入且持有股票能够取得的最大利润；secondSell[i]表示第i天进入状态(5)第二次买入但未持有股票(已经卖出)能够取得的最大利润。

显然，类比上述两道题目的分析：

第i天处于状态(2)第一次买入且持有股票只能由两种情况转来：一是第i - 1天就处于此状态；二是第i - 1天处于状态(1)未进行过股票交易，第i天进行股票买入。因此有转移方程： $f i r s t B u y [i] = M a t h . m a x (f i r s t B u y [i - 1], 0 - p r i c e s [i])$

第i天处于状态(3)第一次买入但未持有股票(已经卖出) 只能由两种情况转来：一是第i - 1天就处于此状态；二是第i - 1天处于状态(2)第一次买入且持有股票，第i天进行股票卖出。因此有转移方程： $f i r s t S e l l [i] = M a t h . m a x (f i r s t S e l l [i - 1], f i r s t B u y [i - 1] + p r i c e s [i])$

第i天处于状态(4)第二次买入且持有股票只能由两种情况转来：一是第i - 1天就处于此状态；二是第i - 1天处于状态(3)第一次买入但未持有股票(已经卖出)，第i天进行股票买入。因此有转移方程： $s e c o n d B u y [i] = M a t h . m a x (s e c o n d B u y [i - 1], f i r s t S e l l [i - 1] - p r i c e s [i])$

第i天处于状态(5)第二次买入但未持有股票(已经卖出) 只能由两种情况转来：一是第i - 1天就处于此状态；二是第i - 1天处于状态(4)第二次买入且持有股票，第i天进行股票卖出。因此有转移方程： $s e c o n d S e l l [i] = M a t h . m a x (s e c o n d S e l l [i - 1], s e c o n d B u y [i - 1] + p r i c e s [i])$

根据上述状态转移方程，可以得到：

class Solution {
    public int maxProfit(int[] prices) {
        int[] firstBuy = new int[prices.length];
        int[] firstSell = new int[prices.length];
        int[] secondBuy = new int[prices.length];
        int[] secondSell = new int[prices.length];
        firstBuy[0] = - prices[0];
        secondBuy[0] = - prices[0];
        for(int i = 1; i < prices.length; i++){
            firstBuy[i] = Math.max(firstBuy[i - 1], - prices[i]);
            firstSell[i] = Math.max(firstSell[i - 1], firstBuy[i - 1] + prices[i]);
            secondBuy[i] = Math.max(secondBuy[i - 1], firstSell[i - 1] - prices[i]);
            secondSell[i] = Math.max(secondSell[i - 1], secondBuy[i - 1] + prices[i]);
        }
        return secondSell[prices.length - 1];
    }
}

值得注意的是，这里firstBuy[0]，secondBuy[0]都要初始化为- prices[0]，第一个很好理解，第二个可以理解为，如果前面的一次交易利润为0。

4.4 空间优化

可以类似地进行空间优化。

class Solution {
    public int maxProfit(int[] prices) {
        int firstBuy = 0, firstSell  = 0, secondBuy = 0, secondSell = 0;
        int firstBuyPrev = - prices[0], firstSellPrev = 0, secondBuyPrev = - prices[0], secondSellPrev = 0;
        for(int i = 1; i < prices.length; i++){
            firstBuy = Math.max(firstBuyPrev, - prices[i]);
            firstSell = Math.max(firstSellPrev, firstBuyPrev + prices[i]);
            secondBuy = Math.max(secondBuyPrev, firstSellPrev - prices[i]);
            secondSell = Math.max(secondSellPrev, secondBuyPrev + prices[i]);
            firstBuyPrev = firstBuy;
            firstSellPrev = firstSell;
            secondBuyPrev = secondBuy;
            secondSellPrev = secondSell;
        }
        return secondSell;
    }
}

4.5 性能分析

类似地：时间复杂度都是O(n)。

法一空间复杂度为O(n)；法二空间复杂度为O（1）。

5 买卖股票的最佳时机 IV

5.1 题目描述

给定一个整数数组 prices ，它的第 i 个元素 prices[i] 是一支给定的股票在第 i 天的价格。

设计一个算法来计算你所能获取的最大利润。你最多可以完成 k 笔交易。

注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。

5.2 示例

输入：k = 2, prices = [2,4,1]

输出：2

输入：k = 2, prices = [3,2,6,5,0,3]

输出：7

5.3 分析与解答

本题将买卖股票的最佳时机 III中的2改为k，要求我们设计一个更为通用的算法。

回想一下，第一题最多允许进行1次交易，有3种状态，其中有一种是原始状态，对结果不造成影响，也即有2种状态；第三题最多允许进行2次交易，有5种状态，其中有一种是原始状态，对结果不造成影响，也即有4种状态。

可以大胆猜想，最多允许进行k次交易，有2k种状态。

这里来简单说明一下，即：(0)第一次买入且持有股票、(1)第一次买入且不持有股票(已经卖出)、(2)第二次买入且持有股票、(3)第二次买入且不持有股票(已经卖出)、…(2k - 1)第k次买入且持有股票、(2k)第k次买入且不持有股票(已经卖出)。

买卖股票的最佳时机限k次

状态转移方程类似于买卖股票的最佳时机 III中的方程，但是我们必须设计一个更为通用的方程。否则for循环中必须写2k个状态转移方程，我们写代码时不知道k的值，写2k个是不现实的。

假设dp[i][j]表示第i天进入状态j时的最大利润。也就是说 $0 = < i < p r i c e s . l e n g t h, 0 < = j < 2 k$ 。

我们观察到，在第i天：当状态标识为偶数时，是买入且持有股票的状态，状态由两种情况转来，一是i - 1天就处于此状态，二是第i - 1天处于第j - 1次的买入且不持有股票(已经卖出)的状态，第i天进行买入操作，有状态转移方程
$d p [i] [j] = M a t h . m a x (d p [i - 1] [j], d p [i - 1] [j - 1] - p r i c e s [i])$
当状态标识为偶数时，是买入且不持有股票(已经卖出)的状态，状态由两种情况转来，一是i - 1天就处于此状态，二是第i - 1天处于第j - 1次的买入且持有股票的状态，第i天进行卖出操作，有状态转移方程 $d p [i] [j] = M a t h . m a x (d p [i - 1] [j], d p [i - 1] [j - 1] + p r i c e s [i])$

由状态转移方程可以得到以下解答：

class Solution {
    public int maxProfit(int k, int[] prices) {
        if(k == 0 || prices.length == 0) return 0;
        int[][] dp = new int[prices.length][2 * k];
        for(int i = 0; i < k; i++){
            dp[0][2 * i] = - prices[0];
        }
        for(int i = 1; i < prices.length; i++){
            for(int j = 0; j < 2 * k; j++){
                if(j == 0) dp[i][j] = Math.max(dp[i - 1][j], - prices[i]);
                else if(j % 2 == 0) dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] - prices[i]);
                else dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] + prices[i]);
            }
        }
        return dp[prices.length - 1][2 * k - 1];
    }
}

5.4 空间优化

同样的，由于我们只需要记录第i天和i - 1 天的情况，因此可以优化一下空间，利用2个数组滚动存放第i天和i - 1 天的利润值。即dp[0][j]表示第i - 1天情况，dp[1][j]表示第i天情况。

class Solution {
    public int maxProfit(int k, int[] prices) {
        if(k == 0 || prices.length == 0) return 0;
        int[][] dp = new int[2][2 * k];
        for(int i = 0; i < k; i++){
            dp[0][2 * i] = - prices[0];
        }
        for(int i = 1; i < prices.length; i++){
            for(int j = 0; j < 2 * k; j++){
                if(j == 0) dp[1][j] = Math.max(dp[0][j], - prices[i]);
                else if(j % 2 == 0) dp[1][j] = Math.max(dp[0][j], dp[0][j - 1] - prices[i]);
                else dp[1][j] = Math.max(dp[0][j], dp[0][j - 1] + prices[i]);
            }
            for(int j = 0; j < 2 * k; j++){
                dp[0][j] = dp[1][j];
            }
        }
        return dp[1][2 * k - 1];
    }
}

5.5 逆向迭代的空间优化

观察两个主要的状态转移方程：
dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] - prices[i])和
dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] + prices[i])
进入第j个状态时，前置条件是第i - 1天的j状态或者第i - 1天的j - 1状态。

如果我们进行j的正向迭代，那么根据方程，j - 1被更新过，也就是说第i - 1天的j - 1被第i天的j - 1覆盖掉了，所以不能拿来更新第i天的j，需要拿另外保存的数据。

如果我们进行j的逆向迭代，则不需要额外的变量来记录第i - 1天的情况，因为第i天j - 1还没更新，数组中保存的还是第i - 1天的j - 1。

class Solution {
    public int maxProfit(int k, int[] prices) {
        if(k == 0 || prices.length == 0) return 0;
        int[] dp = new int[2 * k];
        for(int i = 0; i < k; i++){
            dp[2 * i] = - prices[0];
        }
        for(int i = 1; i < prices.length; i++){
            for(int j = 2 * k - 1; j >= 0; j--){
                if(j == 0) dp[j] = Math.max(dp[j], - prices[i]);
                else if(j % 2 == 0) dp[j] = Math.max(dp[j], dp[j - 1] - prices[i]);
                else dp[j] = Math.max(dp[j], dp[j - 1] + prices[i]);
            }
        }
        return dp[2 * k - 1];
    }
}

5.6 性能分析

两重for循环，时间复杂度都是O(nk)。

法一空间复杂度为O(nk)；法二和法三空间复杂度为O（k）。

6 最佳买卖股票时机含冷冻期

6.1 题目描述

给定一个整数数组，其中第 i 个元素代表了第 i 天的股票价格。

设计一个算法计算出最大利润。在满足以下约束条件下，你可以尽可能地完成更多的交易（多次买卖一支股票）:

你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。
卖出股票后，你无法在第二天买入股票 (即冷冻期为 1 天)。

6.2 示例

输入: [1,2,3,0,2]

输出: 3

6.3 分析与解答

前面2道hard都懂了的话，看这题应该比较简单。相比于第2题，这里多了一个状态，冷冻状态。因此，多一个数组记录这个状态的最大利润即可。

class Solution {
    public int maxProfit(int[] prices) {
        int[] buy = new int[prices.length];
        int[] sell = new int[prices.length];
        int[] freeze = new int[prices.length];
        buy[0] = -prices[0];
        for(int i = 1; i < prices.length; i++){
            buy[i] = Math.max(buy[i - 1], freeze[i - 1] - prices[i]);
            sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i]);
            freeze[i] = Math.max(freeze[i - 1], sell[i - 1]);
        }
        return Math.max(sell[prices.length - 1], freeze[prices.length - 1]);
    }
}

空间优化和性能分析不再赘述。

7 买卖股票的最佳时机含手续费

6.1 题目描述

给定一个整数数组 prices，其中第 i 个元素代表了第 i 天的股票价格；整数 fee 代表了交易股票的手续费用。

你可以无限次地完成交易，但是你每笔交易都需要付手续费。如果你已经购买了一个股票，在卖出它之前你就不能再继续购买股票了。

返回获得利润的最大值。

注意：这里的一笔交易指买入持有并卖出股票的整个过程，每笔交易你只需要为支付一次手续费。

6.2 示例

输入：prices = [1, 3, 2, 8, 4, 9], fee = 2

输出：8

6.3 分析与解答

相比于第2题，这里多了一个手续费，注意在卖出时扣减手续费即可。

class Solution {
    public int maxProfit(int[] prices, int fee) {
        int[] buy = new int[prices.length];
        int[] sell = new int[prices.length];
        buy[0] = -prices[0];
        for(int i = 1; i < prices.length; i++){
            buy[i] = Math.max(buy[i - 1], sell[i - 1] - prices[i]);
            sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i] - fee);
        }
        return sell[prices.length - 1];
    }
}

空间优化和性能分析不再赘述。

本文首发于微信公众号：宅猫coding