基于文本分类多层次垃圾短信过滤系统的研究

基于文本分类多层次垃圾短信过滤系统的研究

ID:34626653

大小:1.44 MB

页数:76页

时间:2019-03-08

基于文本分类多层次垃圾短信过滤系统的研究_第1页
基于文本分类多层次垃圾短信过滤系统的研究_第2页
基于文本分类多层次垃圾短信过滤系统的研究_第3页
基于文本分类多层次垃圾短信过滤系统的研究_第4页
基于文本分类多层次垃圾短信过滤系统的研究_第5页
资源描述:

《基于文本分类多层次垃圾短信过滤系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据CategoryNumber:LevelofSecrecy:SerialNumber:StudentNumber:Master'sDissertationofChongqingUniversityofTechnologyResearchonMulti-levelspamshortmessagesfilteringsystembasedontextclassificationPostgraduate:LiXue-meiSupervisor:Prof.zhangJingSpecialty:SignalandinformationProcessingResearchDirec

2、tion:InformationProcessingDirectionTrainingUnit:SchoolofElectronicInformationandAutomationThesisDeadline:April10,2012OralDefenseDate:May29,2012万方数据万方数据重庆理工大学学位论文原创性声明本人郑重声明:所呈交的学位论文是本人在导师的指导下,独立进行研究所取得的成果。除文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果、作品。对本文的研究做出重要贡献的集体和个人,均已在文中以明确方式标明。本人承担本声明的法律

3、后果。作者签名:李雪梅日期:2012年5月30日学位论文使用授权声明本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权重庆理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于(请在以下相应方框内打“√”):1.保密□,在年解密后适用本授权书。2.不保密□。作者签名:李雪梅日期:2012年5月30日导师签名:张兢日期:2012年5月30日万方数据I万方数据摘要摘要近年来,手机短信受到广大用户的青睐,但此项

4、业务产生的垃圾短信也严重困扰着人们的生活,干扰着正常的社会秩序,因此,各电信运营商纷纷出台垃圾短信过滤系统,以打击垃圾短信的严重泛滥。目前常用的过滤方法主要有黑白名单过滤机制,基于短信长度及流量的过滤机制,基于关键字匹配的过滤机制,以及基于文本分类智能算法的过滤机制,这些机制虽然在一定程度上遏制了垃圾短信的泛滥,但仍具有明显的缺陷和不足。本文受生物免疫系统的启发,借鉴生物免疫原理,提出了基于文本分类的多层次垃圾短信过滤系统的设计,系统分为几个模块,逐层过滤,环环相扣,使垃圾短信无处遁形。本文所做的工作以及创新点如下:(1)分析了垃圾短信的研究现状,包括成因、危害和主要特征,并对

5、国内外现有的垃圾短信过滤机制进行了总结,探讨了各种机制的优缺点。(2)详细介绍了垃圾短信过滤关键技术,包括文本预处理、中文分词以及特征选择等技术。详细阐述了生物免疫系统原理以及由此开发的人工免疫算法,并对传统的算法进行了改进,简化了抗体和抗原的表示方法和计算方式,使亲和力的计算更加简单,节约了内存,提高了匹配速度。(3)设计了一个基于文本分类的多层次垃圾短信过滤系统,系统由黑白名单模块、短信长度及流量门限模块、内容快速匹配模块和人工免疫模块构成,制定了各模块的主要功能和系统的处理流程。(4)人工免疫模块通过对数据库里的短信进行训练,抗体自体耐受生成合格检测器,对短信进行分类,还

6、可以通过变异机制不断更新短信特征样本库,维持短信样本库的生命力、多样性和自适应性。通过实验表明,相比传统方法而言,本文提出的基于文本分类的多层次垃圾短信过滤系统成功的提高了过滤垃圾短信的智能性、可靠性、正确率和实时性。是一种智能化的改进和完善,具有十分广阔的工程应用前景。关键词:垃圾短信,多层过滤,文本分类,人工免疫算法I万方数据重庆理工大学硕士学位论文II万方数据AbstractAbstractInrecentyears,mobilephoneshortmessagesfavoredbythemajorityofusers,spamshortmessagesgenerated

7、bythisbusinessseriouslytroubledpeople’slives,interferedwiththenormalsocialorder.Therefore,thetelecommunicationoperatorshaveintroducedspamshortmessagesfilteringsystemtofightspamshortmessagesseriousflooding.Now,commonlyusedfiltermethodsaremainlywithb

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。