贝叶斯数据挖掘算法在反垃圾邮件中的研究

贝叶斯数据挖掘算法在反垃圾邮件中的研究

ID:33293444

大小:1.66 MB

页数:67页

时间:2019-02-23

贝叶斯数据挖掘算法在反垃圾邮件中的研究_第1页
贝叶斯数据挖掘算法在反垃圾邮件中的研究_第2页
贝叶斯数据挖掘算法在反垃圾邮件中的研究_第3页
贝叶斯数据挖掘算法在反垃圾邮件中的研究_第4页
贝叶斯数据挖掘算法在反垃圾邮件中的研究_第5页
资源描述:

《贝叶斯数据挖掘算法在反垃圾邮件中的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、辽宁工程技术大学硕士学位论文贝叶斯数据挖掘算法在反垃圾邮件中的研究姓名:米亚静申请学位级别:硕士专业:计算机应用技术指导教师:李义杰20061201辽宁工程技术大学硕士学位论文摘要目前,解决垃圾邮件问题有众多的途径和思路,其中基于内容的垃圾邮件过滤方法是一个较为重要的方面,也是当前解决垃圾邮件问题的主流技术之一,它主要包括基于规则的方法和基于贝叶斯方法两个方向。文中重点介绍了朴素贝叶斯垃圾邮件分类模型,并在此基础上提出了一种新的垃圾邮件分类方法一贝叶斯参数估计邮件分类方法。通过采用基于朴素贝叶斯方法和基于贝矸斯参数估计方法两种方法进行部件过

2、滤对比试验,最终得出结论认为:基于贝叶斯参数估计方法是一种更有效的垃圾邮件过滤方法,新方法与朴素贝叶斯邮件过滤方法相比具有更高的准确性。关键词:数据挖掘;贝叶斯;垃圾邮件;参数估计;邮件过滤辽宁工程技术大学硕士学位论文ⅡABSTRACTToday,manymeanscanbeappliedtoresolvetheproblemofspam.Content·basedspamfilteringisoneofthemainstreamtechnologiesusedsofar.Itincludestwo·asides:rule·basedapp

3、roachandbayes-basedapproach.ThearticleintroducedNBC(NavieBayesianClassifier),andbasedonthisalgorithmanewalgorithm·-···BayesParameterEstimationisproposedinthispaper.TheE·mailfilteringexperimentalresultsbetweentheNBCandBayesParameterEstimationshowthatthealgorithmofBayesParam

4、eterEstimationhavefairlysatisfactoryperformance,theneweralgorithmhasmuchhigherratetoconvergethanthenaiveBayesone.Keywords:DataMining;Bayes;Spare·email;Parameterestimation;Emailfiltering创新点声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果:遘鼓塞理=企盔L素贝肚瓤撞圾邮鲑分类摸型h.差聋此基趟上提出了.=全颤施酆仕分类茏法贝吐斯

5、参数值过算鎏_.逼过实验诞明工新友法辕抽素贝吐斯友法j镳赢朐丑凰奎租正确率_.是=孢邮仕公类的蓊途径。尽我所知,到目前国内外文献未见报道。作者:基亚盔垒日期:垄丑曼:堡1绪论随着网络的速度迅猛增长,电子邮件以其快捷、经济的通信优点也得到飞速发展。但是,许多广告、反动信息、色情信息、病毒或蠕虫引起的垃圾邮件也在网络中深度扩散。因垃圾邮件数量多,具有反复性、强制性,欺骗性、不健康性或传播速度快等特点,严重干扰了人们正常生活,浪费用户的时间、精力,甚至造成很多额外的经济支出和信息安全隐患。尽管一些商业化产品允许用户人工建立垃圾邮件的过滤规则,但是

6、系统要求用户应具有丰富的经验,且需花销许多时间,况且垃圾邮件在不断改变,用户必须经常调整这些规则。因此,研究邮件自动过滤方法具有重要意义。1.1垃圾邮件发展历史首次关于垃圾邮件的记录是1985年8月一封通过电子邮件发送的链锁信,一直持续到1993年。1993年6月份,在Internet上出现了名为“MakeMoneyFast”的电子邮件。历史上比较著名的SPAM事件是1994年4月份,Canter和Siegel的法律事务所把一封信发到6000多个新闻组,宣传获得美国国内绿卡的法律支持,这是第一次使用spam一词来称呼垃圾邮件,用来描述新闻或

7、电子邮件的主动性发布。同时垃圾邮件也开始引起了人们的注意,一些触觉敏锐的商人立刻意识到了电子邮件带来的商机,许多人开始利用电子邮件作商业广告。1995年5月有人写出了第一个专门的应用程序Floodgate,可以自动把邮件发给大批的人。紧接着在8月份,就有人拿两百万个邮件地址来出售,垃圾邮件越来越多与商业联系起来,并引起人们的反感。1996年4月;人们开始使用ucE(unsolicitedCommercialEmail)来称呼垃圾邮件,并开始积极想办法阻止垃圾邮件在Internet上泛滥。迄今为止,垃圾邮件(spam,junkmail)在国际

8、上没有统一的定义。在《中国互联网协会反垃圾邮件规范》⋯中垃圾邮件被界定为:辽宝王猩挂丕盔堂亟主堂焦迨塞2(1)收件人事先没有提出要求或者同意接收的广告、电子刊物、各种形式的宣传品

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。