python动态规划求两个字符串的公共子序列-CFANZ编程社区

动态规划求解两个字符串的公共子序列

在计算机科学中，公共子序列问题是一个经典的研究课题。给定两个字符串，我们希望找出它们的最长公共子序列（Longest Common Subsequence，LCS）。该问题可以通过动态规划有效解决。本文将详细介绍如何实现这一算法，并提供代码示例，以及相关的状态图来帮助理解。

什么是公共子序列？

公共子序列是指在两个字符串中都出现的子序列。子序列是从原始字符串删除一些字符（可以是零个或多个字符），而不改变其余字符的顺序所形成的新字符串。例如，在字符串 "ABC" 和 "AC" 中，"AC" 是它们的公共子序列，而 "AB" 并不是。

动态规划的基本思路

动态规划的思路是将大问题分解为小问题，通过存储小问题的解来避免重复计算，从而提高效率。对公共子序列问题而言，我们可以构建一个二维数组来存储每个子问题的解。

状态定义

设定 dp[i][j] 表示字符串 X[0..i-1] 和字符串 Y[0..j-1] 的最长公共子序列的长度。

如果 X[i-1] == Y[j-1]，那么 dp[i][j] = dp[i-1][j-1] + 1。
否则，dp[i][j] = max(dp[i-1][j], dp[i][j-1])。

边界条件

对于任意字符串，与空字符串的最长公共子序列长度为 0。即 dp[i][0] = 0 和 dp[0][j] = 0。

代码示例

以下是使用 Python 实现的最长公共子序列的动态规划算法：

def longest_common_subsequence(X, Y):
    m = len(X)
    n = len(Y)

    # 创建一个二维数组 dp 来存储子问题的解
    dp = [[0] * (n + 1) for _ in range(m + 1)]

    # 填充 dp 数组
    for i in range(1, m + 1):
        for j in range(1, n + 1):
            if X[i - 1] == Y[j - 1]:  # 如果字符相等
                dp[i][j] = dp[i - 1][j - 1] + 1
            else:  # 否则取最大值
                dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])

    # 返回最长公共子序列的长度
    return dp[m][n]

# 示例
X = "AGGTAB"
Y = "GXTXAYB"
print("最长公共子序列的长度是:", longest_common_subsequence(X, Y))

状态图

下面是状态转移的过程图，展示了动态规划的状态转换关系：

stateDiagram
    [*] --> dp[0][0]
    dp[0][0] --> dp[1][0] : Initialize
    dp[0][0] --> dp[0][1] : Initialize
    dp[i][j] --> dp[i-1][j-1] : 如果 X[i-1] == Y[j-1]
    dp[i][j] --> dp[i-1][j] : 否则取 max
    dp[i][j] --> dp[i][j-1] : 否则取 max