贝叶斯算法在垃圾邮件过滤系统中的运用

贝叶斯算法在垃圾邮件过滤系统中的运用

ID:37122624

大小:742.57 KB

页数:67页

时间:2019-05-18

贝叶斯算法在垃圾邮件过滤系统中的运用_第1页
贝叶斯算法在垃圾邮件过滤系统中的运用_第2页
贝叶斯算法在垃圾邮件过滤系统中的运用_第3页
贝叶斯算法在垃圾邮件过滤系统中的运用_第4页
贝叶斯算法在垃圾邮件过滤系统中的运用_第5页
资源描述:

《贝叶斯算法在垃圾邮件过滤系统中的运用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、贝叶斯算法在垃圾邮件过滤系统中的运用摘要电子邮件作为互联网技术发展的产物,在给全球网民带来通讯便利的同时,正不可避免地遭遇有悖初衷的运用。垃圾邮件问题日益严重,受到研究人员的广泛关注。目前经常采用的垃圾邮件过滤技术一般包括白名单与黑名单技术、规则过滤以及基于关键词匹配的内容扫描等。另外一条路线就是从电子邮件的文本内容入手,使用文本分类、信息过滤的算法。本文详细分析邮件过滤中的贝叶斯算法的运用。第一章首先对于电子邮件的发展做简要回顾,然后详细介绍了互联网垃圾邮件泛滥的现状,在此基础上最后归纳了垃圾邮件的类型特征和现有的反垃圾邮件技术。第二章基于内容过滤技术是目前反垃圾邮

2、件用到的主要技术。本文综述了目前用于垃圾邮件过滤研究的各种语料和评价方法,并总结了目前使用的垃圾邮件过滤技术以及它们之间的对比实验,得到贝叶斯过滤方法的优点分析。论文的第三章详细分析邮件过滤中的简单贝叶斯算法。使用Ling-Spam邮件语料实验贝叶斯算法的性能,并比较特征数量、分类阈值以及语料的预处理层次对结果的影响。第四章主要讲述了在简单贝叶斯算法的基础上,利用最小风险贝叶斯算法修正过滤器,设计出了一种新的电子邮件过滤系统模型,重点讨论了系统所需处理的几个关键问题,最后给出了实验结果。最后,论文总结了作者所做的工作,展望了未来需要深入研究的内容。关键字电子邮件,垃圾

3、邮件,简单贝叶斯,最小风险贝叶斯THEAPPLISIANOFBAYESIANONTHEEMAILFILTERINGSYSTEMABSTRACTAstheproductofInternettechnology,Emailcanprovideconvenientcommunication.Ontheotherhand,someapplicationsrelatedtoEmailcausebigtroubletotheInternet.Theincreasinglyseriousissueofspamdrawstheextensiveattentionofresearche

4、rs.Presently,anti-spammeasurescommonlyincludeblackandwhitelisttechnology,manualrulesandkeywordbasedcontentfiltering.Anotherapproachisusingautomatedtextcategorizationandinformationfilteringtofilterspam.ThisthesiswillmainlyanalyzetheapplicationofBayesinmailfiltering.Inchapterone,thedevlop

5、mentofe-mailisreviewedfirstly.Then,thepresentstateofspamisintroducedindetail.Aftertheauthorsummarizestheintrinsicalreasonofthenetworkspamandconcludesthecharactersandtypesofspamandthepresentanti-spamtechnologies.Inchaptertwo,content-basedspamfilteringisconsideredthemaintechnologyavailabl

6、epresently.Theauthorsummarizesallkindsofcorpusandappraisalwaysappliedtospamfilteringresearchandconcludesthepresentspamfilteringtechnologiesandcomparisonexperiment,reachingthestrongpointofBayes.Inchapterthree,WeconsidermethodsforlearningNaïveBayesianclassifierandcomparetheinfectionsoffea

7、turenumber,thresholdandthevariationsofcorpusinLing-Spam.Inchapterfour,BasedonthesimpleBayesianarithmetic,anewmodelforE-mailfiltersystemisdesignedusingtheleastriskBayestorevisethefilter,severalkeyproblemsindealingwiththerealizationofthesystemarediscussed,andlastly,theresultofthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。