资源描述:
《算法设计动态规划(编辑距离)》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、《算法设计与分析》课程报告课题名称:动态规划一一编辑距离问题课题负责人名(学号):同组成员名单(角色):无指导教师:左勣评阅成绩:评阅意见:提交报告时间:2010年6月23日动态规划——编辑距离问题计算机科学与技术专业学生指导老师左訪[摘要]动态规划的基本思想与分治法类似,也是将待求解的问题分解成若干份的子问题,先分别解决好子问题,然后从子问题屮得到最终解。但动态规划中的子问题往往不是相互独立的,而是彼此之间有影响,因为有些子问题可能要重复计算多次,所以利用动态规划使这些子问题只计算一次。将字符串A变换为字符串所用的最少字符
2、操作数称为字符串A到B的编辑距离。关键词:动态规划矩阵字符串操作数编辑距离一、问题描述1、基本概念:设A和B是2个字符串。耍用最少的字符操作将字符串A转换为字符串B。字符串操作包括:(1)删除一个字符;(2)插入一个字符;(3)将一个字符改为另一个字符。将字符串A变换为字符串B所用的最少字符操作数称为字符串A到B的编辑距离,记为〃(A,B)。2、算法设计:设计一个有效算法,对于给定的任意两个字符串A和B,计算其编辑距离d(A,B)。3、数据输入:输入数据由文件名为input.txt的文本文件提供。文件的第1行为字符串A,第二
3、行为字符串Bo4、结果输出:将编辑距离d(A,B)输出到文件ouput.txt的第一行。输入文件示例输出文件示例input.txtoutput.txtfxpimu5xwrs二、分析对于本问题,大体思路为:把求解编辑距离分为字符串A从。个字符逐渐增加到全部字符分别想要变为字符串B该如何变化以及变化的最短距离。具体来说,首先选用数组al存储字符串A(设长度为n),a2存储字符串B(设长度为m),d矩阵来进行具体的运算;这里有两个特殊情况比较简单可以单独考虑,即A的长度为0而B不为0还有A不为0B为0,这两种情况最后的编辑距离分别
4、为m和m讨论一般情况,d矩阵为d[n][m],假定我们从d[0][0]开始一直进行以下操作到了d[i][j]的位置,其中删除操作肯定是a比By,同理,插入字符操作一定是A比B短,更改字符操作说明一样长,我们所要做的是对d[i][j-l]d[i-l][j]d[i-l][j-l]所存数进行比较,其中最小的即为当前长度和样式的字符串A变为B的编辑距离,依次这样计算到最后的d[n][m]中所存的数即为最终的编辑距离。三、证明1、理论前提:动态规划的基本思想与分治法类似,也是将待求解的问题分解成若干份的子问题,先分别解决好子问题,然后
5、从子问题中得到最终解。但动态规划中的子问题往往不是相互独立的,而是彼此之间有影响。该算法的有效性依赖于两个重要的性质:最优子结构性质和问题重叠性质。最有子结构性:以自底向上的方法递归地从子问题的最优解逐步构造出整个问题的最优解。重叠子问题性:每次产生的子问题并不总是新问题,利用动态规划对每一个子问题只解一次,并将其存入表格中,下次用到该子问题的解时,只要查找表格即可。2、本题:本题首先符合最优子结构性,即让字符串A从1开始递增到最终长度n,也就是从只有一个字符开始计算,每增加一个字符计算一次,符合自底向上的方法递归地解决子问
6、题;其次符合重叠子问题性,每增加一个字符计算的时候总要用到前一状态时的编辑距离,并且本题我采用了矩阵来存储旧子问题的数据,都只计算了一次,所以也符合。3、总结:综上两点,可知本题采用了动态规划的思想来解决,并能得到正确的答案。四、代码及解释(注释)#include#include#include#includeusingnamespacestd;constintMAX=1000;intmin(inta,intb){if(a>=b)returnb
7、;elsereturna;intmain(){intd[MAX][MAX];inti,j;charal[MAX],a2[MAX];FILE*fp;fp=fopen("input.txtH,"rn);fscanf(fp,"%s",al);fscanf(fp,"%s",a2);fclose(fp);intn=strlen(al)・1;intm=strlen(a2)-l;for(i=0;i<=n;i+4-)d[i][0]=i;for(i=0;i<=m;i++)d[0][i]=i;for(i=l;i<=n;i++)〃字符串末尾多1〃
8、从i变到0字符串,i个需要门欠(添加)〃从0字符串变到j,j个需要了次(删除)d[i][j]=min(min(d[i][j-l],d[i-l][j]),d[i-l][j-l])+l;〃加一个,减一个,变一个elsed[i]
9、j]=d[M][j-l];}}cout«d[n][m];fp=fo