欢迎来到天天文库
浏览记录
ID:33495166
大小:2.65 MB
页数:78页
时间:2019-02-26
《快速模式串匹配技术的研究及一个邮件内容过滤系统的实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中国科学院计算技术研究所硕士学位论文快速模式串匹配技术的研究及一个邮件内容过滤系统的实现姓名:张鑫申请学位级别:硕士专业:计算机软件和理论指导教师:程学旗20030510摘要随着国际互联网Intemet的不断发展,网络信息不断膨胀,需要进行实时检索的临时数据也随之迅速增长。如何能够及时准确的在庞大的实时网络信息流中找到特定的信息,已经成为当前研究特别是在网络安全的入侵监测领域研究的热点。快速的精确多模式串匹配算法的研究正是为了解决这些实际问题而进行的。本篇论文从理论和应用两方面对精确模式串匹配算法进行了研究,取得了以下成果:本文总结了
2、当前精确模式串匹配算法的研究现状,介绍并实现了当前性能最好的主要算法。这些算法包括单模式串匹配算法中的KMP算法、BoyerMoore算法和BOM(BackwardOracleMatching)算法:多模式串匹配算法中的AhoCorasick算法、WuManber算法和SBOM(SetBackwardOracleMatching)算法。本文使用两种改进方法:精确错误块字符转移和弱化的良好后缀转移,在wuManber多模式串匹配算法的基础上提出了改进的WuManber算法:WMPro算法。本文使用中英文实际语料(圣经和97年人民日报的节
3、选)对精确多模式串匹配算法进行实验。实验结果验证了在处理自然语言的数据时,WuManber算法要优于当前其他主要算法的结论;实验结果证明了本文提出的WMPro算法在各种情况下的性能表现都优于原始WuManber算法。WMPro算法在这些实验中是性能最好的多模式串匹配算法。本文提出了对压缩数据流进行内容检测的解决方案,设计和实现了一个针对Gzip和Zip格式压缩数据的快速解压匹配模块,能够对网络传输中分包的压缩数据流进行实时检测(无需完整压缩文件);同时使用zlib通用压缩函数库最为比较对象,对模块的效率进行了对比实验。实验结果证明该模
4、块能够使用比一般过程少10~20%的时间完成匹配工作。本文设计和实现了电子邮件内容过滤系统。在WMPro算法的基础上,针对邮件传输中的特定编码(Base64编码和QuotedPrintable编码)格式的邮件正文进行匹配的实际问题,完成了Base64编码数据匹配和QuotedPrintable编码数据匹配模块。系统使用TCP协议层t传输的电子邮件数据包完成了对电子邮件的内容过滤任务。关键词:模式串踞配,字符串匹配,匹配,压缩匹A{,邮沣内容过滤AbstmclResearchonFastPatternMatchingAlgorithms
5、andanImplementationofanEmailContentFilterSystemZhangXin(ComputerSoftwareandTheory)DirectedbyChengXunqiNowadays,informationintheInternetisexploding,andtherealtimecommunicatingdata,whichisrequiredexaminedforsomepurpose,isalsoincreasinginthesameway.Howtolocatethepiecesofso
6、meparticularinformationinthegiganticdatastreammorequicklyandaccuratelyisgettingmoreandmorefocusinresearch,especiallyintheintrusiondetectionfieldfornetworksecurity.Fasterexactpatternmatchingalgorithmsareinventedtosolvesuchproblems.Thestudyofexactpattemmatchingalgorithmsi
7、ntheoryandapplicationarebothpresentedinthisarticle,andtheachievementsaleasfollowing:Asummaryaboutthestateofartofexactpatternmatchingalgorithmsisintroducedinthisthesis.Itilluminatesthebasicdesignideaandimplementationdetailsofmajoralgorithmsinthisfield.ThesealgorithmsareK
8、MPalgorithm,BoyerMoorealgorithmandBOM(backwardoraclematching)algorithminsinglepatternmatchingfield;AhoCorasick
此文档下载收益归作者所有