[动态规划]DP20 计算字符串的编辑距离-中等-CFANZ编程社区

DP20 计算字符串的编辑距离

知识点字符串动态规划

[动态规划]DP20 计算字符串的编辑距离-中等_字符串

校招时部分企业笔试将禁止编程题跳出页面，为提前适应，练习时请使用在线自测，而非本地IDE。

描述

Levenshtein 距离，又称编辑距离，指的是两个字符串之间，由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符，插入一个字符，删除一个字符。编辑距离的算法是首先由俄国科学家 Levenshtein 提出的，故又叫 Levenshtein Distance 。

例如：

字符串A: abcdefg

字符串B: abcdef

通过增加或是删掉字符 ”g” 的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。

要求：

给定任意两个字符串，写出一个算法计算它们的编辑距离。

数据范围：给定的字符串长度满足

输入描述：

每组用例一共2行，为输入的两个字符串

输出描述：

每组用例输出一行，代表字符串的距离

示例1

输入：

abcdefg
abcdef

输出：

题解

动态规划解法

假设输入的2个字符串分别为a和b

步骤：

设dp[i][k]表示从长度为i的字符串a转换到长度为k的字符串b需要的编辑距离
初始条件：dp[i][0] = i,dp[0][k] = k，表示长度为0的字符串转换为长度为i、k的字符串所需要的步骤
递推关系：

如果a[i-1] 等于 b[k-1]，则dp[i][k]=dp[i-1][k-1]
否则，dp[i][k]可以从a[i-1]中插入一个字符编程b[k]，也可以从a[i]中删除一个字符编程b[k-1]，也可以从a[i]中替换一个字符变成b[k]

代码如下：

#include <iostream>
#include <algorithm>
#include <string>
#include <vector>
using namespace std;

int solve(const std::string &a, const std::string &b)
{
  if (a.size() == 0)
  {
    return b.size();
  }

  if (b.size() == 0)
  {
    return a.size();
  }

  std::vector<std::vector<int>> dp(a.size() + 1, std::vector<int>(b.size() + 1, 0));
  for (int i = 0; i <= a.size(); ++i)
  {
    dp[i][0] = i;
  }
  for (int i = 0; i <= b.size(); ++i)
  {
    dp[0][i] = i;
  }

  for (int i = 1; i <= a.size(); ++i)
  {
    for (int k = 1; k <= b.size(); ++k)
    {
      if (a[i - 1] == b[k - 1])
      {
        dp[i][k] = dp[i - 1][k - 1];
      }
      else
      {
        // dp[i - 1][k]表示在b中插入一个字符，也就是原来a[0,i-1]字符串变成b[0,k]有dp[i-1][k]的距离，现在在次基础上再在b中插入一个字符
        // dp[i][k - 1]表示在a中删除一个字符，也就是原来a[0,i]字符串变成b[0,k-1]有dp[i][k-1]的距离，现在在次基础上再在a中删除一个字符
        // dp[i-1][k - 1]表示在a中替换一个字符，也就是原来a[0,i-1]字符串变成b[0,k-1]有dp[i-1][k-1]的距离，现在将a[i]替换成b[k]
        dp[i][k] = std::min(std::min(dp[i - 1][k], dp[i][k - 1]), dp[i - 1][k - 1]) + 1;
      }
    }
  }
  return dp[a.size()][b.size()];
}

int main()
{
  std::string a, b;
  std::cin >> a >> b;
  std::cout << solve(a, b) << std::endl;
  return 0;
}