1 本文内容
- 动态规划专题,通过股票买卖问题学习一维、二维的动态规划算法以及滚动数组的空间优化。
- leetcode 121. 买卖股票的最佳时机【easy】
- leetcode 122. 买卖股票的最佳时机 II【medium】
- leetcode 123. 买卖股票的最佳时机 III【hard】
- leetcode 188. 买卖股票的最佳时机 IV【hard】
- leetcode 309. 最佳买卖股票时机含冷冻期【medium】
- leetcode 714. 买卖股票的最佳时机含手续费【medium】
2 买卖股票的最佳时机
2.1 题目描述
给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。
你只能选择某一天买入这只股票,并选择在未来的某一个不同的日子卖出该股票。设计一个算法来计算你所能获取的最大利润。
返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润,返回 0 。
2.2 示例
输入:[7,1,5,3,6,4]
输出:5
输入:prices = [7,6,4,3,1]
输出:0
2.3 容易理解的动态规划解法
首先提炼题信息(1)我们从始至终只能进行一次交易;(2)只有买入和卖出两种操作可以改变我们的的利润。
分析上述信息我们发现:(1)从始至终只存在三种状态:未进行过股票交易、买入且持有股票、买入且但未持有股票(已经卖出)。(2)第i天处于何种状态及获得怎样的收益只取决于第i - 1天的状态和收益。
假设buy[i]
表示第i天进入买入且持有股票状态能够取得的最大利润;sell[i]
表示第i天进入买入但未持有股票(已经卖出)状态 能够取得的最大利润。
可以得到状态转移方程(1):
b
u
y
[
i
]
=
M
a
t
h
.
m
a
x
(
b
u
y
[
i
−
1
]
,
0
−
p
r
i
c
e
s
[
i
]
)
buy[i] = Math.max(buy[i - 1], 0 - prices[i])
buy[i]=Math.max(buy[i−1],0−prices[i])
因为第i天处于买入且持有股票状态有两种情况,要么是第i - 1 天就已经处于该状态,所以利润不变;要么就是第i - 1天之前都未进行过股票交易,在第i天进行了买入操作,则利润为 0 - prices[i]
。
也可以得到状态转移方程(2):
s
e
l
l
[
i
]
=
M
a
t
h
.
m
a
x
(
s
e
l
l
[
i
−
1
]
,
b
u
y
[
i
−
1
]
+
p
r
i
c
e
s
[
i
]
)
sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i])
sell[i]=Math.max(sell[i−1],buy[i−1]+prices[i])
因为第i天处于买入但未持有股票(已经卖出)状态有两种情况,要么是第i - 1 天就已经处于该状态,所以利润变;要么之前处于买入且持有股票状态,今天进行卖出。
所以有:
class Solution {
public int maxProfit(int[] prices) {
int[] sell = new int[prices.length];
int[] buy = new int[prices.length];
buy[0] = - prices[0];
for(int i = 1; i < prices.length; i++){
buy[i] = Math.max(buy[i - 1], 0 - prices[i]);
sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i]);
}
return sell[prices.length - 1];
}
}
最后返回sell[prices.length - 1];
是因为获取最大利润的情况必然是股票已经卖出的状态。
2.4 空间优化的动态规划解法
上面我们已经分析过,第i天处于何种状态及获得怎样的收益只取决于第i - 1天的状态和收益,因此我们不需要记录除i - 1和i以外的任何一天的状态。以此可以将两个数组优化为四个常量:sellPrev, sellCur, buyPrev, sellCur。
解答为:
class Solution {
public int maxProfit(int[] prices) {
int buyPrev = -prices[0], sellPrev = 0;
int buyCur = 0, sellCur = 0;
for(int i = 1; i < prices.length; i++){
buyCur = Math.max(buyPrev, - prices[i]);
sellCur = Math.max(sellPrev, buyPrev + prices[i]);
buyPrev = buyCur;
sellPrev = sellCur;
}
return sellCur;
}
}
2.5 性能分析
两种动态规划解法只进行了规模为prices.length的单层for循环迭代,因此时间复杂度都是O(n)
。
第一种解法开了2个大小为prices.length的数组,因此空间复杂度为O(n)
;第二种解法将空间优化为常量,因此空间复杂度为O(1)
。
3 买卖股票的最佳时机 II
3.1 题目描述
给定一个数组 prices ,其中 prices[i] 是一支给定股票第 i 天的价格。
设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易(多次买卖一支股票)。
注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。
3.2 示例
输入: prices = [7,1,5,3,6,4]
输出: 7
输入: prices = [1,2,3,4,5]
输出: 4
3.3 分析与解答
与上一题的区别只有一个,本题可以进行无限次交易而上一题只能进行一次交易。
也就是说,上一题得到的分析结论仍然成立:(1)从始至终只存在三种状态:未进行过股票交易、买入且持有股票、买入且但未持有股票(已经卖出)。(2)第i天处于何种状态及获得怎样的收益只取决于第i - 1天的状态和收益。
不同在于:当第i天处于买入且持有股票状态时这里有三种情况,第一种是第i - 1 天就已经处于该状态,所以利润不变;第二种是第i - 1天处于买入且但未持有股票(已经卖出)的状态,在第i天进行了买入操作,则利润为 sell[i - 1] - prices[i]
;第三种是第i - 1天之前都未进行过股票交易,在第i天进行了买入操作,则利润为 0 - prices[i]
。但显然,第二种得到的利润一定会比第三种高,所以在计算时可以忽略该状态。
因此状态转移方程(1)发生了改变: b u y [ i ] = M a t h . m a x ( b u y [ i − 1 ] , s e l l [ i − 1 ] − p r i c e s [ i ] ) buy[i] = Math.max(buy[i - 1], sell[i - 1] - prices[i]) buy[i]=Math.max(buy[i−1],sell[i−1]−prices[i])
根据状态转移方程解答如下:
class Solution {
public int maxProfit(int[] prices) {
int[] buy = new int[prices.length];
int[] sell = new int[prices.length];
buy[0] = -prices[0];
for(int i = 1; i < prices.length; i++){
buy[i] = Math.max(buy[i - 1], sell[i - 1] - prices[i]);
sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i]);
}
return sell[prices.length - 1];
}
}
3.4 空间优化
经过分析,状态转移方程只有一点点改变,因此很容易得出类似的空间优化版本。
class Solution {
public int maxProfit(int[] prices) {
int buyPrev = -prices[0], sellPrev = 0;
int buyCur = 0, sellCur = 0;
for(int i = 1; i < prices.length; i++){
buyCur = Math.max(buyPrev, sellPrev - prices[i]);
sellCur = Math.max(sellPrev, buyPrev + prices[i]);
buyPrev = buyCur;
sellPrev = sellCur;
}
return sellCur;
}
}
3.5 性能分析
类似地:时间复杂度都是O(n)
。
法一空间复杂度为O(n)
;法二空间复杂度为O(1)
。
4 买卖股票的最佳时机 III
4.1 题目描述
给定一个数组,它的第 i 个元素是一支给定的股票在第 i 天的价格。
设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。
注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。
4.2 示例
输入:prices = [3,3,5,0,0,3,1,4]
输出:6
输入:prices = [1,2,3,4,5]
输出:4
4.3 分析与解答
限制最多交易两次使得情况更加的复杂,之前无限制交易或限制一次交易我们都可以简单地将状态分为三种:未进行过股票交易、买入且持有股票、买入且但未持有股票(已经卖出)。而这里不得不将状态分为五种:
状态(1)未进行过股票交易、状态(2)第一次买入且持有股票、状态(3)第一次买入但未持有股票(已经卖出)、状态(4)第二次买入且持有股票、(5)第二次买入但未持有股票(已经卖出)
这里我们也不去管状态(1)。假设firstBuy[i]
表示第i天进入 状态(2)第一次买入且持有股票 能够取得的最大利润;fistSell[i]
表示第i天进入 状态(3)第一次买入但未持有股票(已经卖出)能够取得的最大利润;seondBuy[i]
表示第i天进入 状态(4)第一次买入且持有股票 能够取得的最大利润;secondSell[i]
表示第i天进入 状态(5)第二次买入但未持有股票(已经卖出)能够取得的最大利润。
显然,类比上述两道题目的分析:
第i天处于 状态(2)第一次买入且持有股票 只能由两种情况转来:一是第i - 1天就处于此状态;二是第i - 1天处于状态(1)未进行过股票交易,第i天进行股票买入。因此有转移方程: f i r s t B u y [ i ] = M a t h . m a x ( f i r s t B u y [ i − 1 ] , 0 − p r i c e s [ i ] ) firstBuy[i] = Math.max(firstBuy[i - 1], 0 - prices[i]) firstBuy[i]=Math.max(firstBuy[i−1],0−prices[i])
第i天处于 状态(3)第一次买入但未持有股票(已经卖出) 只能由两种情况转来:一是第i - 1天就处于此状态;二是第i - 1天处于状态(2)第一次买入且持有股票,第i天进行股票卖出。因此有转移方程: f i r s t S e l l [ i ] = M a t h . m a x ( f i r s t S e l l [ i − 1 ] , f i r s t B u y [ i − 1 ] + p r i c e s [ i ] ) firstSell[i] = Math.max(firstSell[i - 1], firstBuy[i - 1] + prices[i]) firstSell[i]=Math.max(firstSell[i−1],firstBuy[i−1]+prices[i])
第i天处于 状态(4)第二次买入且持有股票 只能由两种情况转来:一是第i - 1天就处于此状态;二是第i - 1天处于状态(3)第一次买入但未持有股票(已经卖出),第i天进行股票买入。因此有转移方程: s e c o n d B u y [ i ] = M a t h . m a x ( s e c o n d B u y [ i − 1 ] , f i r s t S e l l [ i − 1 ] − p r i c e s [ i ] ) secondBuy[i] = Math.max(secondBuy[i - 1], firstSell[i - 1] - prices[i]) secondBuy[i]=Math.max(secondBuy[i−1],firstSell[i−1]−prices[i])
第i天处于 状态(5)第二次买入但未持有股票(已经卖出) 只能由两种情况转来:一是第i - 1天就处于此状态;二是第i - 1天处于状态(4)第二次买入且持有股票,第i天进行股票卖出。因此有转移方程: s e c o n d S e l l [ i ] = M a t h . m a x ( s e c o n d S e l l [ i − 1 ] , s e c o n d B u y [ i − 1 ] + p r i c e s [ i ] ) secondSell[i] = Math.max(secondSell[i - 1], secondBuy[i - 1] + prices[i]) secondSell[i]=Math.max(secondSell[i−1],secondBuy[i−1]+prices[i])
根据上述状态转移方程,可以得到:
class Solution {
public int maxProfit(int[] prices) {
int[] firstBuy = new int[prices.length];
int[] firstSell = new int[prices.length];
int[] secondBuy = new int[prices.length];
int[] secondSell = new int[prices.length];
firstBuy[0] = - prices[0];
secondBuy[0] = - prices[0];
for(int i = 1; i < prices.length; i++){
firstBuy[i] = Math.max(firstBuy[i - 1], - prices[i]);
firstSell[i] = Math.max(firstSell[i - 1], firstBuy[i - 1] + prices[i]);
secondBuy[i] = Math.max(secondBuy[i - 1], firstSell[i - 1] - prices[i]);
secondSell[i] = Math.max(secondSell[i - 1], secondBuy[i - 1] + prices[i]);
}
return secondSell[prices.length - 1];
}
}
值得注意的是,这里firstBuy[0]
,secondBuy[0]
都要初始化为- prices[0]
,第一个很好理解,第二个可以理解为,如果前面的一次交易利润为0。
4.4 空间优化
可以类似地进行空间优化。
class Solution {
public int maxProfit(int[] prices) {
int firstBuy = 0, firstSell = 0, secondBuy = 0, secondSell = 0;
int firstBuyPrev = - prices[0], firstSellPrev = 0, secondBuyPrev = - prices[0], secondSellPrev = 0;
for(int i = 1; i < prices.length; i++){
firstBuy = Math.max(firstBuyPrev, - prices[i]);
firstSell = Math.max(firstSellPrev, firstBuyPrev + prices[i]);
secondBuy = Math.max(secondBuyPrev, firstSellPrev - prices[i]);
secondSell = Math.max(secondSellPrev, secondBuyPrev + prices[i]);
firstBuyPrev = firstBuy;
firstSellPrev = firstSell;
secondBuyPrev = secondBuy;
secondSellPrev = secondSell;
}
return secondSell;
}
}
4.5 性能分析
类似地:时间复杂度都是O(n)
。
法一空间复杂度为O(n)
;法二空间复杂度为O(1)
。
5 买卖股票的最佳时机 IV
5.1 题目描述
给定一个整数数组 prices ,它的第 i 个元素 prices[i] 是一支给定的股票在第 i 天的价格。
设计一个算法来计算你所能获取的最大利润。你最多可以完成 k 笔交易。
注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。
5.2 示例
输入:k = 2, prices = [2,4,1]
输出:2
输入:k = 2, prices = [3,2,6,5,0,3]
输出:7
5.3 分析与解答
本题将 买卖股票的最佳时机 III中的2改为k,要求我们设计一个更为通用的算法。
回想一下,第一题最多允许进行1次交易,有3种状态,其中有一种是原始状态,对结果不造成影响,也即有2种状态;第三题最多允许进行2次交易,有5种状态,其中有一种是原始状态,对结果不造成影响,也即有4种状态。
可以大胆猜想,最多允许进行k次交易,有2k种状态。
这里来简单说明一下,即:(0)第一次买入且持有股票、(1)第一次买入且不持有股票(已经卖出)、(2)第二次买入且持有股票、(3)第二次买入且不持有股票(已经卖出)、…(2k - 1)第k次买入且持有股票、(2k)第k次买入且不持有股票(已经卖出)。
状态转移方程类似于 买卖股票的最佳时机 III中的方程,但是我们必须设计一个更为通用的方程。否则for循环中必须写2k个状态转移方程,我们写代码时不知道k的值,写2k个是不现实的。
假设dp[i][j]
表示第i天进入状态j时的最大利润。也就是说
0
=
<
i
<
p
r
i
c
e
s
.
l
e
n
g
t
h
,
0
<
=
j
<
2
k
0= < i < prices.length, 0 <= j < 2k
0=<i<prices.length,0<=j<2k。
我们观察到,在第i天:当状态标识为偶数时,是买入且持有股票的状态,状态由两种情况转来,一是i - 1天就处于此状态,二是第i - 1天处于第j - 1次的 买入且不持有股票(已经卖出)的状态,第i天进行买入操作,有状态转移方程
d
p
[
i
]
[
j
]
=
M
a
t
h
.
m
a
x
(
d
p
[
i
−
1
]
[
j
]
,
d
p
[
i
−
1
]
[
j
−
1
]
−
p
r
i
c
e
s
[
i
]
)
dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] - prices[i])
dp[i][j]=Math.max(dp[i−1][j],dp[i−1][j−1]−prices[i])
当状态标识为偶数时,是买入且不持有股票(已经卖出)的状态,状态由两种情况转来,一是i - 1天就处于此状态,二是第i - 1天处于第j - 1次的 买入且持有股票的状态,第i天进行卖出操作,有状态转移方程
d
p
[
i
]
[
j
]
=
M
a
t
h
.
m
a
x
(
d
p
[
i
−
1
]
[
j
]
,
d
p
[
i
−
1
]
[
j
−
1
]
+
p
r
i
c
e
s
[
i
]
)
dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] + prices[i])
dp[i][j]=Math.max(dp[i−1][j],dp[i−1][j−1]+prices[i])
由状态转移方程可以得到以下解答:
class Solution {
public int maxProfit(int k, int[] prices) {
if(k == 0 || prices.length == 0) return 0;
int[][] dp = new int[prices.length][2 * k];
for(int i = 0; i < k; i++){
dp[0][2 * i] = - prices[0];
}
for(int i = 1; i < prices.length; i++){
for(int j = 0; j < 2 * k; j++){
if(j == 0) dp[i][j] = Math.max(dp[i - 1][j], - prices[i]);
else if(j % 2 == 0) dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] - prices[i]);
else dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] + prices[i]);
}
}
return dp[prices.length - 1][2 * k - 1];
}
}
5.4 空间优化
同样的,由于我们只需要记录第i天和i - 1 天的情况,因此可以优化一下空间,利用2个数组滚动存放第i天和i - 1 天的利润值。即dp[0][j]
表示第i - 1天情况,dp[1][j]
表示第i天情况。
class Solution {
public int maxProfit(int k, int[] prices) {
if(k == 0 || prices.length == 0) return 0;
int[][] dp = new int[2][2 * k];
for(int i = 0; i < k; i++){
dp[0][2 * i] = - prices[0];
}
for(int i = 1; i < prices.length; i++){
for(int j = 0; j < 2 * k; j++){
if(j == 0) dp[1][j] = Math.max(dp[0][j], - prices[i]);
else if(j % 2 == 0) dp[1][j] = Math.max(dp[0][j], dp[0][j - 1] - prices[i]);
else dp[1][j] = Math.max(dp[0][j], dp[0][j - 1] + prices[i]);
}
for(int j = 0; j < 2 * k; j++){
dp[0][j] = dp[1][j];
}
}
return dp[1][2 * k - 1];
}
}
5.5 逆向迭代的空间优化
观察两个主要的状态转移方程:
dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] - prices[i])
和
dp[i][j] = Math.max(dp[i - 1][j], dp[i - 1][j - 1] + prices[i])
进入第j个状态时,前置条件是第i - 1天的j状态或者第i - 1天的j - 1状态。
如果我们进行j的正向迭代,那么根据方程,j - 1被更新过,也就是说第i - 1天的j - 1被第i天的j - 1覆盖掉了,所以不能拿来更新第i天的j,需要拿另外保存的数据。
如果我们进行j的逆向迭代,则不需要额外的变量来记录第i - 1天的情况,因为第i天j - 1还没更新,数组中保存的还是第i - 1天的j - 1。
class Solution {
public int maxProfit(int k, int[] prices) {
if(k == 0 || prices.length == 0) return 0;
int[] dp = new int[2 * k];
for(int i = 0; i < k; i++){
dp[2 * i] = - prices[0];
}
for(int i = 1; i < prices.length; i++){
for(int j = 2 * k - 1; j >= 0; j--){
if(j == 0) dp[j] = Math.max(dp[j], - prices[i]);
else if(j % 2 == 0) dp[j] = Math.max(dp[j], dp[j - 1] - prices[i]);
else dp[j] = Math.max(dp[j], dp[j - 1] + prices[i]);
}
}
return dp[2 * k - 1];
}
}
5.6 性能分析
两重for循环,时间复杂度都是O(nk)
。
法一空间复杂度为O(nk)
;法二和法三空间复杂度为O(k)
。
6 最佳买卖股票时机含冷冻期
6.1 题目描述
给定一个整数数组,其中第 i 个元素代表了第 i 天的股票价格 。
设计一个算法计算出最大利润。在满足以下约束条件下,你可以尽可能地完成更多的交易(多次买卖一支股票):
- 你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。
- 卖出股票后,你无法在第二天买入股票 (即冷冻期为 1 天)。
6.2 示例
输入: [1,2,3,0,2]
输出: 3
6.3 分析与解答
前面2道hard都懂了的话,看这题应该比较简单。相比于第2题,这里多了一个状态,冷冻状态。因此,多一个数组记录这个状态的最大利润即可。
class Solution {
public int maxProfit(int[] prices) {
int[] buy = new int[prices.length];
int[] sell = new int[prices.length];
int[] freeze = new int[prices.length];
buy[0] = -prices[0];
for(int i = 1; i < prices.length; i++){
buy[i] = Math.max(buy[i - 1], freeze[i - 1] - prices[i]);
sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i]);
freeze[i] = Math.max(freeze[i - 1], sell[i - 1]);
}
return Math.max(sell[prices.length - 1], freeze[prices.length - 1]);
}
}
空间优化和性能分析不再赘述。
7 买卖股票的最佳时机含手续费
6.1 题目描述
给定一个整数数组 prices,其中第 i 个元素代表了第 i 天的股票价格 ;整数 fee 代表了交易股票的手续费用。
你可以无限次地完成交易,但是你每笔交易都需要付手续费。如果你已经购买了一个股票,在卖出它之前你就不能再继续购买股票了。
返回获得利润的最大值。
注意:这里的一笔交易指买入持有并卖出股票的整个过程,每笔交易你只需要为支付一次手续费。
6.2 示例
输入:prices = [1, 3, 2, 8, 4, 9], fee = 2
输出:8
6.3 分析与解答
相比于第2题,这里多了一个手续费,注意在卖出时扣减手续费即可。
class Solution {
public int maxProfit(int[] prices, int fee) {
int[] buy = new int[prices.length];
int[] sell = new int[prices.length];
buy[0] = -prices[0];
for(int i = 1; i < prices.length; i++){
buy[i] = Math.max(buy[i - 1], sell[i - 1] - prices[i]);
sell[i] = Math.max(sell[i - 1], buy[i - 1] + prices[i] - fee);
}
return sell[prices.length - 1];
}
}
空间优化和性能分析不再赘述。
本文首发于微信公众号:宅猫coding