KMP算法详解课件.ppt

KMP算法详解课件.ppt

ID:51446077

大小:511.75 KB

页数:16页

时间:2020-03-22

KMP算法详解课件.ppt_第1页
KMP算法详解课件.ppt_第2页
KMP算法详解课件.ppt_第3页
KMP算法详解课件.ppt_第4页
KMP算法详解课件.ppt_第5页
资源描述:

《KMP算法详解课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、本PPT格式说明:代码全部以图片形式给出字符串样例全部以couriernew字体给出注释全部以华文细黑字体给出文字讲解以微软雅黑或verdana字体给出数学公式中的括号全部为半角括号()文字性解释说明中的括号全部为中文全角括号()KMPKnuth-Morris-Pratt字符串匹配查找算法abababcdabcdbbacabacaabSabacaPabababcdabcdbbacabacaabSabacaPabababcdabcdbbacabacaabSabacaPabababcdabcdbbacabacaabSabacaPa

2、bababcdabcdbbacabacaabSabacaPabababcdabcdbbacabacaabSabacaP事实上,我们在之前匹配的过程中已经知道了s[2]=b≠p[1]=a,i,j都回溯必然失配。那怎样降低时间复杂度呢?引入KMP算法,使用这个算法可以将上面O(nm)的复杂度降低为O(n+m)。KMP算法的核心思想是:文本串s的指针i不回溯。那是不是只需要在暴力的基础上保持失配时i不变就行了呢?你会发现:还是浪费了很多时间。有没有一种方法可以在失配时让j直接跳到一个应该跳到的位置上去呢?这就来到KMP的大核心——n

3、ext数组。next数组表示的意思是当前字符之前的子串中最长相同前缀后缀的长度。说人话:当前字符之前模式串P子串最长相同前缀后缀的长度。手写个小Demo演示一下:abaabcaPnext0001120注:一个字符串的相同前缀后缀是不包括这个字符串本身的,比如字符串”ab”,它就没有相同前缀后缀,字符串”a”同理。next的意义:如果当前两个字符失配,那么模式串P应该移动到哪,换言之,应该用P中的哪个字符来继续匹配s[i]。保证文本串S的指针i不回溯。next的求解:不必每次记录前缀后缀,前面匹配成功的字符,后面可以直接拿来用。

4、为什么求一个相同最长前缀后缀长度就可以解决这个问题:假设在模式串红色位置失配:abaaabacbc失配了,j要回溯,也就是模式串相对于文本串要右移。右移多少位呢?我们发现,既然当前位置前面的所有字符都匹配成功,那么它最长相同前缀后缀上的字符也都相同。这些相同前缀后缀上的字符不需要再匹配,用这之中前缀的后面一个字符匹配当前字符即可,即失配时,模式串向右移动的位数为:已匹配字符数-失配字符的上一位字符所对应的最大长度值。算法一的错误之处在于:如果出现没出现过的字符,会陷入死循环。abaabcaPnext00011?//i为next

5、[]的下标,t为next[]的值//-1和0都表示没有相同的前缀后缀//t=-1同样可以达到next[1]=0的效果,想想为什么//从1到(lenp-1)枚举i//①//赋值next[]//②①如果这是一个新字符(t==-1)那么就赋值next[i]为0(-1+1=0)。②t=next[t]的含义其实是t=next[t]-1+1。abaabcaPnext-1001120it求完了next数组,下面就可以开始KMP了。模拟之前提到的过程就可以,可以总结为下面两条规则:规则一:如果匹配成功,i++,j++;规则二:如果失配,i不动

6、,j回溯到next[j]。代码十分容易理解,可能需要解释的就是输出模式串所在位置的条件,详见下页。//规则一//规则二//如果模式串最后一个字符也匹配成功就输出这个//合法位置如果整个模式串匹配成功,j要回溯到next[j]。至此,KMP算法介绍结束。时间复杂度O(lens+lenp)。谢谢~

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。