浅谈基于支持向量机理论的垃圾邮件过滤模型

浅谈基于支持向量机理论的垃圾邮件过滤模型

ID:35125628

大小:2.95 MB

页数:107页

时间:2019-03-19

浅谈基于支持向量机理论的垃圾邮件过滤模型_第1页
浅谈基于支持向量机理论的垃圾邮件过滤模型_第2页
浅谈基于支持向量机理论的垃圾邮件过滤模型_第3页
浅谈基于支持向量机理论的垃圾邮件过滤模型_第4页
浅谈基于支持向量机理论的垃圾邮件过滤模型_第5页
资源描述:

《浅谈基于支持向量机理论的垃圾邮件过滤模型》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电子科技大学硕士学位论文基于支持向量机理论的垃圾邮件过滤模型姓名:张羽申请学位级别:硕士专业:计算机系统结构指导教师:卢显良20060103摘要随着互联网的普及,电子邮件以其快捷,方便的优点逐渐发展成为人们工作和生活的重要通信工具之一。然而,随之而来的垃圾邮件问题也日益严峻,它不仅传播有害信息,而且耗费大量的公共资源,侵害电子邮件用户和企业的合法权益。当前已经存在许多的垃圾邮件过滤方法,但是目前垃圾邮件不降反升的局面表明,虽然当前垃圾邮件过滤方法众多,但是还有许多垃圾邮件相关问题没有找到好的解决办法,垃圾邮件过滤效果不是很理想。所以,研究一种更加新型高效的,快速的邮件过滤系统仍

2、具有特别的现实意义。支持向量机(SVM)是在统计学习理论的基础上发展而来的一种新的模式识别方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。它不仅考虑了对推广能力的要求,而且追求在有限信息的条件下得到最优结果。其中,SMO方法是相对众多已有研究的SVM算法较为简单的算法,它将工作样本集中的样本数减少为2,避开了复杂的数值求解优化问题的过程,但是相应的代价就是迭代次数的增加。本文提出-,oe基于支持向量机理论的垃圾邮件过滤模型,模型使用的过滤算法是一种改进型的SMO算法一sMO主动学习算法。该算法能很好的继承SMO的优势,同时又解决SMO算法的不足,减少二次寻

3、优的迭代次数。本模型主要以探索为目的,观察其可行性和有效性。初步实验证明,该模型具有过滤效果好,训练时间短的特点。本文首先介绍了垃圾邮件的基本常识,包括垃圾邮件的定义和危害,然后介绍了现有的垃圾邮件过滤方法。由于基于SVM的垃城邮件过滤方法是以内容过滤为主,所以还着重阐述了与内容过滤相关的文本分类以及机器学习的知识。其次,介绍了统计学理论中SVM理论的定义和邮件样本预处理工作的内容,并由SVM理论引申出SVM垃圾邮件过滤算法,推导出SVM垃圾邮件过滤模型,在模型实现部分还给出了重点代码框架。最后是对SVM垃圾邮件过滤模型性能评估和对其性能优化的讨论。此外,论文中还讨论了反馈学习

4、技术在SVM垃圾邮件过滤模型中的研究,希望能够在以后的工作中能够将我们的SVM垃圾邮件过滤算法与反馈技术相结合,确保实现过滤效果更优的垃圾邮件过滤模型。总之,本文提出的SVM垃圾邮件过滤模型的优点在于通过一种改进的SMO主动学习算法来改善传统SVM算法中由于样本数目较大时,占用大量内存以及在二次型寻优过程中要进行大量的矩阵运算的问题,并且通过主动学习的方法,电子科技大学硕士学位论文减少了二次寻优的迭代次数。初步实验结果的评估表明,本论文提出的新的邮件过滤模型在一定环境下具备良好的过滤性能。关键词:垃圾邮件过滤,支持向量机,SMO(序列最小优化)理论,SMO主动学习算法,反馈学习

5、技术IIAbstractWiththeprevalenceofinternet,electronicmail,bytheadvantageofitsrapidnessandconvenience,hasgraduallydevelopedasoneofthemostsignificantcorrespondingnleansforpeople’sworkandeverydaylife.However,thecomingupspamproblembecomesseriousincreasingly,either.Itwillnotonlyspreadillegitimateinf

6、ormation,butalsoconsumelargecapacityofpublicintemetresourcesandaggn’eveemailusers’andenterprises’legitimaterights.Sofar,thereexistmanykindsofspamfilteringmethods.Thesituationnowisthatthespareproblemsarenotwellsolvedtobedepressedbutincreasedinstead.Itdemonstratesthatalthou-ghtherearemanyspanf

7、ilteringmethods,somerelativeissueshaven'tfoundtheappropriatesolutionsandthefilteringeffectisnotuptotheidealstate.Thus,itisstillquitemeaningfultoresearchandacquireamorehighly-efficientandfastspamfilteringsystem.SupportVectorMachineisanewly-developed

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。