0
点赞
收藏
分享

微信扫一扫

【字符串处理算法】获取最长公共子串的算法设计及C代码实现


一、需求描述

输入两个字符串,编写程序获取这两个字符串的第一个最长公共子串。

例如,输入的字符串为“abcdef”和“fecdba”,那么这两个字符串的第一个最长公共子串为“cd”。

 

二、算法设计

我们可以首先寻找两个字符串中的第一个相等的字符,然后分别向后移动来比较对应位置的字符是否相等。

即如果字符串1为“1234abcd”,字符串2为“abd”,那么首先发现字符串1中的第五个字符“a”与字符串2中的第一个字符“a”相等,接着字符串1中的第六个字符“b”与字符串2中的第二个字符“b”相等,再接着发现字符串1中的第七个字符“c”与字符串2中的第三个字符“d”不相等,此时比较结束。也就是说字符串1和字符串2的最长公共子串为“ab”。

 

三、特殊流程考虑

在编写程序的过程中,我们要对输入的字符串的长度及格式多做考虑,如:

1.如果输入的两个字符串之一含有中文字符,那么程序直接返回而不执行后续流程。

2.如果输入的两个字符串之一含有空格,那么程序获取空格之前的字符串进行后续操作。

 

四、程序代码

 

/**********************************************************************
* 版权所有 (C)2016, Zhou Zhaoxiong。
*
* 文件名称: GetLCS.c
* 文件标识: 无
* 内容摘要: 寻找两个字符串的最长公共子串
* 其它说明: 例如, "abcdef"和"bcf"的最长公共子串是"bc"
* 当前版本: V1.0
* 作 者: Zhou Zhaoxiong
* 完成日期: 20160322
*
**********************************************************************/
#include


#include


#include




// 重新定义数据类型
typedef signed char INT8;
typedef int INT32;
typedef unsigned int UINT32;

// 函数声明
void GetLCSOfTwoStr(INT8 *pszInputStr1, INT8 *pszInputStr2);


/**********************************************************************
* 功能描述: 主函数
* 输入参数: 无
* 输出参数: 无
* 返 回 值: 0-执行成功 其它-执行失败
* 其它说明: 无
* 修改日期 版本号 修改人 修改内容
* ---------------------------------------------------------------------
* 20160322 V1.0 Zhou Zhaoxiong 创建
***********************************************************************/
INT32 main()
{
INT8 szInputStr1[100] = {0};
INT8 szInputStr2[100] = {0};
UINT32 iPosFlag = 0;

printf("Please input string1: \n");
scanf("%s", szInputStr1);
printf("InputStr1=%s\n", szInputStr1);

printf("Please input string2: \n");
scanf("%s", szInputStr2);
printf("InputStr2=%s\n", szInputStr2);

// 先判断是否有中文字符
for (iPosFlag = 0; iPosFlag < strlen(szInputStr1); iPosFlag ++)
{
if (szInputStr1[iPosFlag] < 0) // 小于0则表示含有中文字符
{
printf("%s has Chinese character, please check!\n", szInputStr1);
return -1;
}
}

for (iPosFlag = 0; iPosFlag < strlen(szInputStr2); iPosFlag ++)
{
if (szInputStr2[iPosFlag] < 0) // 小于0则表示含有中文字符
{
printf("%s has Chinese character, please check!\n", szInputStr2);
return -1;
}
}

// 再调用函数获取两个字符串的最长公共子串
GetLCSOfTwoStr(szInputStr1, szInputStr2);

return 0;
}


/**********************************************************************
* 功能描述: 获取两个字符串的最长公共子串
* 输入参数: pszInputStr1-输入字符串1
pszInputStr2-输入字符串2
* 输出参数: 无
* 返 回 值: 无
* 其它说明: 无
* 修改日期 版本号 修改人 修改内容
* ---------------------------------------------------------------------
* 20160322 V1.0 Zhou Zhaoxiong 创建
***********************************************************************/
void GetLCSOfTwoStr(INT8 *pszInputStr1, INT8 *pszInputStr2)
{
UINT32 iInnerLoopFlag = 0;
UINT32 iOutterLoopFlag = 0;
UINT32 iPosFlag = 0;
UINT32 iLCSLen = 0;
INT32 iStartPos = -1;
INT8 szLCS[100] = {0};

if (pszInputStr1 == NULL || pszInputStr2 == NULL)
{
return;
}

for (iOutterLoopFlag = 0; iOutterLoopFlag < strlen(pszInputStr1); iOutterLoopFlag ++)
{
for (iInnerLoopFlag = 0; iInnerLoopFlag < strlen(pszInputStr2); iInnerLoopFlag ++)
{
if (pszInputStr1[iOutterLoopFlag] == pszInputStr2[iInnerLoopFlag])
{
for (iPosFlag = 1; pszInputStr1[iOutterLoopFlag+iPosFlag] != '\0'; iPosFlag ++)
{
if (pszInputStr1[iOutterLoopFlag+iPosFlag] != pszInputStr2[iInnerLoopFlag+iPosFlag]) // 遇到不相等的字符, 则退出比较
{
break;
}
}

if (iLCSLen < iPosFlag)
{
iLCSLen = iPosFlag;
iStartPos = iOutterLoopFlag;
}
}
}
}

if (iStartPos == -1)
{
memset(szLCS, 0x00, sizeof(szLCS));
}
else
{
memcpy(szLCS, &pszInputStr1[iStartPos], iLCSLen);
}

if (iLCSLen > 0)
{
printf("%s和%s的最长公共子串是:%s, 其长度是:%d\n", pszInputStr1, pszInputStr2, szLCS, iLCSLen);
}
else
{
printf("%s和%s无公共子串!\n", pszInputStr1, pszInputStr2);
}
}

 

五、程序测试

我们将编写好的程序“GetLCS.c”上传到Linux机器,并使用“gcc -g -o GetLCS GetLCS.c”命令对该程序进行编译,生成“GetLCS”文件。下面对程序进行详细的测试。

1.输入字符串1为“abcdef”,字符串2为“hijkabm”时,程序运行情况如下:

Please input string1:

abcdef

InputStr1=abcdef

Please input string2:

hijkabm

InputStr2=hijkabm

abcdef和hijkabm的最长公共子串是:ab, 其长度是:2

 

2.输入字符串1为“1234!@#”,字符串2为“5678!@#1”时,程序运行情况如下:

Please input string1:

1234!@#

InputStr1=1234!@#

Please input string2:

5678!@#1

InputStr2=5678!@#1

1234!@#和5678!@#1的最长公共子串是:!@#, 其长度是:3

 

3.输入字符串1为“123你们好”,字符串2为“123”时,程序运行情况如下:

Please input string1:

123你们好

InputStr1=123你们好

Please input string2:

123

InputStr2=123

123你们好 has Chinese character, pleasecheck!

 

4.输入字符串1为“123abc”,字符串2为“abd ef”时,程序运行情况如下:

Please input string1:

123abc

InputStr1=123abc

Please input string2:

abd ef

InputStr2=abd

123abc和abd的最长公共子串是:ab, 其长度是:2

 

5.输入字符串1为“abcdef”,字符串2为“123456”时,程序运行情况如下:

Please input string1:

abcdef

InputStr1=abcdef

Please input string2:

123456

InputStr2=123456

abcdef和123456无公共子串!

 

六、需求扩展

基于本文中的需求和程序,我们可考虑对需求进行以下扩展:

1.如果两个字符串有多于一个最长公共子串,则都要将它们输出,即如果字符串1为“1234abcd”,字符串2为“abd12”,那么程序输入的最长公共子串为“12”和“ab”。

2.不限制输入字符串中不能出现中文字符,即如果字符串1为“我们123”,字符串2为“我们”,那么最长公共子串为“我们”。

 

举报

相关推荐

0 条评论