0
点赞
收藏
分享

微信扫一扫

动态规划入门(一):股票买卖系列问题

前行的跋涉者 2022-01-08 阅读 17

1 本文内容

  • 动态规划专题,通过股票买卖问题学习一维、二维的动态规划算法以及滚动数组的空间优化。
  • leetcode 121. 买卖股票的最佳时机【easy】
  • leetcode 122. 买卖股票的最佳时机 II【medium】
  • leetcode 123. 买卖股票的最佳时机 III【hard】
  • leetcode 188. 买卖股票的最佳时机 IV【hard】
  • leetcode 309. 最佳买卖股票时机含冷冻期【medium】
  • leetcode 714. 买卖股票的最佳时机含手续费【medium】

2 买卖股票的最佳时机

2.1 题目描述

给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。

你只能选择某一天买入这只股票,并选择在未来的某一个不同的日子卖出该股票。设计一个算法来计算你所能获取的最大利润。

返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润,返回 0 。

2.2 示例

输入:[7,1,5,3,6,4]

输出:5

输入:prices = [7,6,4,3,1]

输出:0

2.3 容易理解的动态规划解法

首先提炼题信息(1)我们从始至终只能进行一次交易;(2)只有买入和卖出两种操作可以改变我们的的利润。

分析上述信息我们发现:(1)从始至终只存在三种状态:未进行过股票交易、买入且持有股票、买入且但未持有股票(已经卖出)。(2)第i天处于何种状态及获得怎样的收益只取决于第i - 1天的状态和收益。

假设buy[i]表示第i天进入买入且持有股票状态能够取得的最大利润;sell[i]表示第i天进入买入但未持有股票(已经卖出)状态 能够取得的最大利润。

可以得到状态转移方程(1): b u y [ i ] = M a t h . m a x ( b u y [ i − 1 ] , 0 − p r i c e s [ i ] ) buy[i] = Math.max(buy[i - 1], 0 - prices[i]) buy[i]=Math.max(buy[i1],0prices[i])
因为第i天处于买入且持有股票状态有两种情况,要么是第i - 1 天就已经处于该状态,所以利润不变;要么就是第i - 1天之前都未进行过股票交易,在第i天进行了买入操作,则利润为 0 - prices[i]

也可以得到状态转移方程(2): s e l l [ i ] = M a t h . m a x ( s e l l [ i − 1 ] , b u y [ i − 1 ] + p r i c e s [ i ] ) sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i]) sell[i]=Math.max(sell[i1],buy[i1]+prices[i])
因为第i天处于买入但未持有股票(已经卖出)状态有两种情况,要么是第i - 1 天就已经处于该状态,所以利润变;要么之前处于买入且持有股票状态,今天进行卖出。

买卖股票的最佳时机

所以有:

class Solution {
    public int maxProfit(int[] prices) {
        int[] sell = new int[prices.length];
        int[] buy = new int[prices.length];
        buy[0] = - prices[0];
        for(int i = 1; i < prices.length; i++){
            buy[i] = Math.max(buy[i - 1], 0 - prices[i]);
            sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i]);
        }
        return sell[prices.length - 1];
    }
}

最后返回sell[prices.length - 1];是因为获取最大利润的情况必然是股票已经卖出的状态。

2.4 空间优化的动态规划解法

上面我们已经分析过,第i天处于何种状态及获得怎样的收益只取决于第i - 1天的状态和收益,因此我们不需要记录除i - 1和i以外的任何一天的状态。以此可以将两个数组优化为四个常量:sellPrev, sellCur, buyPrev, sellCur。

解答为:

class Solution {
    public int maxProfit(int[] prices) {
        int buyPrev = -prices[0], sellPrev = 0;
        int buyCur = 0, sellCur = 0;
        for(int i = 1; i < prices.length; i++){
            buyCur = Math.max(buyPrev, - prices[i]);
            sellCur = Math.max(sellPrev, buyPrev + prices[i]);
            buyPrev = buyCur;
            sellPrev = sellCur;    
        }
        return sellCur;
    }
}

2.5 性能分析

两种动态规划解法只进行了规模为prices.length的单层for循环迭代,因此时间复杂度都是O(n)
第一种解法开了2个大小为prices.length的数组,因此空间复杂度为O(n);第二种解法将空间优化为常量,因此空间复杂度为O(1)

3 买卖股票的最佳时机 II

3.1 题目描述

给定一个数组 prices ,其中 prices[i] 是一支给定股票第 i 天的价格。

设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易(多次买卖一支股票)。

注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。

3.2 示例

输入: prices = [7,1,5,3,6,4]

输出: 7

输入: prices = [1,2,3,4,5]

输出: 4

3.3 分析与解答

与上一题的区别只有一个,本题可以进行无限次交易而上一题只能进行一次交易。

也就是说,上一题得到的分析结论仍然成立:(1)从始至终只存在三种状态:未进行过股票交易、买入且持有股票、买入且但未持有股票(已经卖出)。(2)第i天处于何种状态及获得怎样的收益只取决于第i - 1天的状态和收益。

买卖股票的最佳时机无限次

不同在于:当第i天处于买入且持有股票状态时这里有三种情况,第一种是第i - 1 天就已经处于该状态,所以利润不变;第二种是第i - 1天处于买入且但未持有股票(已经卖出)的状态,在第i天进行了买入操作,则利润为 sell[i - 1] - prices[i];第三种是第i - 1天之前都未进行过股票交易,在第i天进行了买入操作,则利润为 0 - prices[i]。但显然,第二种得到的利润一定会比第三种高,所以在计算时可以忽略该状态。

因此状态转移方程(1)发生了改变: b u y [ i ] = M a t h . m a x ( b u y [ i − 1 ] , s e l l [ i − 1 ] − p r i c e s [ i ] ) buy[i] = Math.max(buy[i - 1], sell[i - 1] - prices[i]) buy[i]=Math.max(buy[i1],sell[i1]prices[i])

根据状态转移方程解答如下:

class Solution {
    public int maxProfit(int[] prices) {
        int[] buy = new int[prices.length];
        int[] sell = new int[prices.length];
        buy[0] = -prices[0];
        for(int i = 1; i < prices.length; i++){
            buy[i] = Math.max(buy[i - 1], sell[i - 1] - prices[i]);
            sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i]);
        }
        return sell[prices.length - 1];
    }
}

3.4 空间优化

经过分析,状态转移方程只有一点点改变,因此很容易得出类似的空间优化版本。

class Solution {
    public int maxProfit(int[] prices) {
        int buyPrev = -prices[0], sellPrev = 0;
        int buyCur = 0, sellCur = 0;
        for(int i = 1; i < prices.length; i++){
            buyCur = Math.max(buyPrev, sellPrev - prices[i]);
            sellCur = Math.max(sellPrev, buyPrev + prices[i]);
            buyPrev = buyCur;
            sellPrev = sellCur;
        }
        return sellCur;
    }
}

3.5 性能分析

类似地:时间复杂度都是O(n)

法一空间复杂度为O(n);法二空间复杂度为O(1)

4 买卖股票的最佳时机 III

4.1 题目描述

给定一个数组,它的第 i 个元素是一支给定的股票在第 i 天的价格。

设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。

注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。

4.2 示例

输入:prices = [3,3,5,0,0,3,1,4]

输出:6

输入:prices = [1,2,3,4,5]

输出:4

4.3 分析与解答

限制最多交易两次使得情况更加的复杂,之前无限制交易或限制一次交易我们都可以简单地将状态分为三种:未进行过股票交易、买入且持有股票、买入且但未持有股票(已经卖出)。而这里不得不将状态分为五种:
状态(1)未进行过股票交易、状态(2)第一次买入且持有股票、状态(3)第一次买入但未持有股票(已经卖出)、状态(4)第二次买入且持有股票、(5)第二次买入但未持有股票(已经卖出)

买卖股票的最佳时机限2次

这里我们也不去管状态(1)。假设firstBuy[i]表示第i天进入 状态(2)第一次买入且持有股票 能够取得的最大利润;fistSell[i]表示第i天进入 状态(3)第一次买入但未持有股票(已经卖出)能够取得的最大利润;seondBuy[i]表示第i天进入 状态(4)第一次买入且持有股票 能够取得的最大利润;secondSell[i]表示第i天进入 状态(5)第二次买入但未持有股票(已经卖出)能够取得的最大利润。

显然,类比上述两道题目的分析:

第i天处于 状态(2)第一次买入且持有股票 只能由两种情况转来:一是第i - 1天就处于此状态;二是第i - 1天处于状态(1)未进行过股票交易,第i天进行股票买入。因此有转移方程: f i r s t B u y [ i ] = M a t h . m a x ( f i r s t B u y [ i − 1 ] , 0 − p r i c e s [ i ] ) firstBuy[i] = Math.max(firstBuy[i - 1], 0 - prices[i]) firstBuy[i]=Math.max(firstBuy[i1],0prices[i])

第i天处于 状态(3)第一次买入但未持有股票(已经卖出) 只能由两种情况转来:一是第i - 1天就处于此状态;二是第i - 1天处于状态(2)第一次买入且持有股票,第i天进行股票卖出。因此有转移方程: f i r s t S e l l [ i ] = M a t h . m a x ( f i r s t S e l l [ i − 1 ] , f i r s t B u y [ i − 1 ] + p r i c e s [ i ] ) firstSell[i] = Math.max(firstSell[i - 1], firstBuy[i - 1] + prices[i]) firstSell[i]=Math.max(firstSell[i1],firstBuy[i1]+prices[i])

第i天处于 状态(4)第二次买入且持有股票 只能由两种情况转来:一是第i - 1天就处于此状态;二是第i - 1天处于状态(3)第一次买入但未持有股票(已经卖出),第i天进行股票买入。因此有转移方程: s e c o n d B u y [ i ] = M a t h . m a x ( s e c o n d B u y [ i − 1 ] , f i r s t S e l l [ i − 1 ] − p r i c e s [ i ] ) secondBuy[i] = Math.max(secondBuy[i - 1], firstSell[i - 1] - prices[i]) secondBuy[i]=Math.max(secondBuy[i1],firstSell[i1]prices[i])

第i天处于 状态(5)第二次买入但未持有股票(已经卖出) 只能由两种情况转来:一是第i - 1天就处于此状态;二是第i - 1天处于状态(4)第二次买入且持有股票,第i天进行股票卖出。因此有转移方程: s e c o n d S e l l [ i ] = M a t h . m a x ( s e c o n d S e l l [ i − 1 ] , s e c o n d B u y [ i − 1 ] + p r i c e s [ i ] ) secondSell[i] = Math.max(secondSell[i - 1], secondBuy[i - 1] + prices[i]) secondSell[i]=Math.max(secondSell[i1],secondBuy[i1]+prices[i])

根据上述状态转移方程,可以得到:

class Solution {
    public int maxProfit(int[] prices) {
        int[] firstBuy = new int[prices.length];
        int[] firstSell = new int[prices.length];
        int[] secondBuy = new int[prices.length];
        int[] secondSell = new int[prices.length];
        firstBuy[0] = - prices[0];
        secondBuy[0] = - prices[0];
        for(int i = 1; i < prices.length; i++){
            firstBuy[i] = Math.max(firstBuy[i - 1], - prices[i]);
            firstSell[i] = Math.max(firstSell[i - 1], firstBuy[i - 1] + prices[i]);
            secondBuy[i] = Math.max(secondBuy[i - 1], firstSell[i - 1] - prices[i]);
            secondSell[i] = Math.max(secondSell[i - 1], secondBuy[i - 1] + prices[i]);
        }
        return secondSell[prices.length - 1];
    }
}

值得注意的是,这里firstBuy[0]secondBuy[0]都要初始化为- prices[0],第一个很好理解,第二个可以理解为,如果前面的一次交易利润为0。

4.4 空间优化

可以类似地进行空间优化。

class Solution {
    public int maxProfit(int[] prices) {
        int firstBuy = 0, firstSell  = 0, secondBuy = 0, secondSell = 0;
        int firstBuyPrev = - prices[0], firstSellPrev = 0, secondBuyPrev = - prices[0], secondSellPrev = 0;
        for(int i = 1; i < prices.length; i++){
            firstBuy = Math.max(firstBuyPrev, - prices[i]);
            firstSell = Math.max(firstSellPrev, firstBuyPrev + prices[i]);
            secondBuy = Math.max(secondBuyPrev, firstSellPrev - prices[i]);
            secondSell = Math.max(secondSellPrev, secondBuyPrev + prices[i]);
            firstBuyPrev = firstBuy;
            firstSellPrev = firstSell;
            secondBuyPrev = secondBuy;
            secondSellPrev = secondSell;
        }
        return secondSell;
    }
}

4.5 性能分析

类似地:时间复杂度都是O(n)

法一空间复杂度为O(n);法二空间复杂度为O(1)

5 买卖股票的最佳时机 IV

5.1 题目描述

给定一个整数数组 prices ,它的第 i 个元素 prices[i] 是一支给定的股票在第 i 天的价格。

设计一个算法来计算你所能获取的最大利润。你最多可以完成 k 笔交易。

注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。

5.2 示例

输入:k = 2, prices = [2,4,1]

输出:2

输入:k = 2, prices = [3,2,6,5,0,3]

输出:7

5.3 分析与解答

本题将 买卖股票的最佳时机 III中的2改为k,要求我们设计一个更为通用的算法。

回想一下,第一题最多允许进行1次交易,有3种状态,其中有一种是原始状态,对结果不造成影响,也即有2种状态;第三题最多允许进行2次交易,有5种状态,其中有一种是原始状态,对结果不造成影响,也即有4种状态。

可以大胆猜想,最多允许进行k次交易,有2k种状态。

这里来简单说明一下,即:(0)第一次买入且持有股票、(1)第一次买入且不持有股票(已经卖出)、(2)第二次买入且持有股票、(3)第二次买入且不持有股票(已经卖出)、…(2k - 1)第k次买入且持有股票、(2k)第k次买入且不持有股票(已经卖出)。

买卖股票的最佳时机限k次

状态转移方程类似于 买卖股票的最佳时机 III中的方程,但是我们必须设计一个更为通用的方程。否则for循环中必须写2k个状态转移方程,我们写代码时不知道k的值,写2k个是不现实的。

假设dp[i][j]表示第i天进入状态j时的最大利润。也就是说 0 = < i < p r i c e s . l e n g t h , 0 < = j < 2 k 0= < i < prices.length, 0 <= j < 2k 0=<i<prices.length,0<=j<2k

我们观察到,在第i天:当状态标识为偶数时,是买入且持有股票的状态,状态由两种情况转来,一是i - 1天就处于此状态,二是第i - 1天处于第j - 1次的 买入且不持有股票(已经卖出)的状态,第i天进行买入操作,有状态转移方程
d p [ i ] [ j ] = M a t h . m a x ( d p [ i − 1 ] [ j ] , d p [ i − 1 ] [ j − 1 ] − p r i c e s [ i ] ) dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] - prices[i]) dp[i][j]=Math.max(dp[i1][j],dp[i1][j1]prices[i])
当状态标识为偶数时,是买入且不持有股票(已经卖出)的状态,状态由两种情况转来,一是i - 1天就处于此状态,二是第i - 1天处于第j - 1次的 买入且持有股票的状态,第i天进行卖出操作,有状态转移方程 d p [ i ] [ j ] = M a t h . m a x ( d p [ i − 1 ] [ j ] , d p [ i − 1 ] [ j − 1 ] + p r i c e s [ i ] ) dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] + prices[i]) dp[i][j]=Math.max(dp[i1][j],dp[i1][j1]+prices[i])

由状态转移方程可以得到以下解答:

class Solution {
    public int maxProfit(int k, int[] prices) {
        if(k == 0 || prices.length == 0) return 0;
        int[][] dp = new int[prices.length][2 * k];
        for(int i = 0; i < k; i++){
            dp[0][2 * i] = - prices[0];
        }
        for(int i = 1; i < prices.length; i++){
            for(int j = 0; j < 2 * k; j++){
                if(j == 0) dp[i][j] = Math.max(dp[i - 1][j], - prices[i]);
                else if(j % 2 == 0) dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] - prices[i]);
                else dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] + prices[i]);
            }
        }
        return dp[prices.length - 1][2 * k - 1];
    }
}

5.4 空间优化

同样的,由于我们只需要记录第i天和i - 1 天的情况,因此可以优化一下空间,利用2个数组滚动存放第i天和i - 1 天的利润值。即dp[0][j]表示第i - 1天情况,dp[1][j]表示第i天情况。

class Solution {
    public int maxProfit(int k, int[] prices) {
        if(k == 0 || prices.length == 0) return 0;
        int[][] dp = new int[2][2 * k];
        for(int i = 0; i < k; i++){
            dp[0][2 * i] = - prices[0];
        }
        for(int i = 1; i < prices.length; i++){
            for(int j = 0; j < 2 * k; j++){
                if(j == 0) dp[1][j] = Math.max(dp[0][j], - prices[i]);
                else if(j % 2 == 0) dp[1][j] = Math.max(dp[0][j], dp[0][j - 1] - prices[i]);
                else dp[1][j] = Math.max(dp[0][j], dp[0][j - 1] + prices[i]);
            }
            for(int j = 0; j < 2 * k; j++){
                dp[0][j] = dp[1][j];
            }
        }
        return dp[1][2 * k - 1];
    }
}

5.5 逆向迭代的空间优化

观察两个主要的状态转移方程:
dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] - prices[i])
dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] + prices[i])
进入第j个状态时,前置条件是第i - 1天的j状态或者第i - 1天的j - 1状态。

如果我们进行j的正向迭代,那么根据方程,j - 1被更新过,也就是说第i - 1天的j - 1被第i天的j - 1覆盖掉了,所以不能拿来更新第i天的j,需要拿另外保存的数据。

如果我们进行j的逆向迭代,则不需要额外的变量来记录第i - 1天的情况,因为第i天j - 1还没更新,数组中保存的还是第i - 1天的j - 1。

class Solution {
    public int maxProfit(int k, int[] prices) {
        if(k == 0 || prices.length == 0) return 0;
        int[] dp = new int[2 * k];
        for(int i = 0; i < k; i++){
            dp[2 * i] = - prices[0];
        }
        for(int i = 1; i < prices.length; i++){
            for(int j = 2 * k - 1; j >= 0; j--){
                if(j == 0) dp[j] = Math.max(dp[j], - prices[i]);
                else if(j % 2 == 0) dp[j] = Math.max(dp[j], dp[j - 1] - prices[i]);
                else dp[j] = Math.max(dp[j], dp[j - 1] + prices[i]);
            }
        }
        return dp[2 * k - 1];
    }
}

5.6 性能分析

两重for循环,时间复杂度都是O(nk)

法一空间复杂度为O(nk);法二和法三空间复杂度为O(k)

6 最佳买卖股票时机含冷冻期

6.1 题目描述

给定一个整数数组,其中第 i 个元素代表了第 i 天的股票价格 。​

设计一个算法计算出最大利润。在满足以下约束条件下,你可以尽可能地完成更多的交易(多次买卖一支股票):

  • 你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。
  • 卖出股票后,你无法在第二天买入股票 (即冷冻期为 1 天)。

6.2 示例

输入: [1,2,3,0,2]

输出: 3

6.3 分析与解答

前面2道hard都懂了的话,看这题应该比较简单。相比于第2题,这里多了一个状态,冷冻状态。因此,多一个数组记录这个状态的最大利润即可。

class Solution {
    public int maxProfit(int[] prices) {
        int[] buy = new int[prices.length];
        int[] sell = new int[prices.length];
        int[] freeze = new int[prices.length];
        buy[0] = -prices[0];
        for(int i = 1; i < prices.length; i++){
            buy[i] = Math.max(buy[i - 1], freeze[i - 1] - prices[i]);
            sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i]);
            freeze[i] = Math.max(freeze[i - 1], sell[i - 1]);
        }
        return Math.max(sell[prices.length - 1], freeze[prices.length - 1]);
    }
}

空间优化和性能分析不再赘述。

7 买卖股票的最佳时机含手续费

6.1 题目描述

给定一个整数数组 prices,其中第 i 个元素代表了第 i 天的股票价格 ;整数 fee 代表了交易股票的手续费用。

你可以无限次地完成交易,但是你每笔交易都需要付手续费。如果你已经购买了一个股票,在卖出它之前你就不能再继续购买股票了。

返回获得利润的最大值。

注意:这里的一笔交易指买入持有并卖出股票的整个过程,每笔交易你只需要为支付一次手续费。

6.2 示例

输入:prices = [1, 3, 2, 8, 4, 9], fee = 2

输出:8

6.3 分析与解答

相比于第2题,这里多了一个手续费,注意在卖出时扣减手续费即可。

class Solution {
    public int maxProfit(int[] prices, int fee) {
        int[] buy = new int[prices.length];
        int[] sell = new int[prices.length];
        buy[0] = -prices[0];
        for(int i = 1; i < prices.length; i++){
            buy[i] = Math.max(buy[i - 1], sell[i - 1] - prices[i]);
            sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i] - fee);
        }
        return sell[prices.length - 1];
    }
}

空间优化和性能分析不再赘述。

本文首发于微信公众号:宅猫coding

举报

相关推荐

0 条评论