基于svm的电子邮件分类系统研究

基于svm的电子邮件分类系统研究

ID:32729901

大小:1.70 MB

页数:54页

时间:2019-02-15

基于svm的电子邮件分类系统研究_第1页
基于svm的电子邮件分类系统研究_第2页
基于svm的电子邮件分类系统研究_第3页
基于svm的电子邮件分类系统研究_第4页
基于svm的电子邮件分类系统研究_第5页
资源描述:

《基于svm的电子邮件分类系统研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、山东师范大学硕士学位论文基于SVM的电子邮件分类系统研究摘要电子邮件是Internet上最广泛使用、最受欢迎的网络功能。随着计算机信息技术的普及,它现在已经演变成为一个更加复杂并丰富的多的系统,可以传送声音、图片、图像、文档等多媒体信息,以至于如数据库或账目报告等更加专业化的文件都可以电子邮件附件的形式在网上分发。现在,电子邮件已成为许多商家和组织机构的生命血脉。用户可以通过电子邮件的讨论会进行项目管理,并且有时要根据快速,或洲际的电子邮件信息交换进行重要的决策行动。然而随着电子邮件数量的增多,如何对电子邮件进行有效的分类,并且过滤出垃圾邮件,成为一个令很多用户烦恼的问

2、题。支持向量机是基于统计学习理论的新一代学习机器,具有很多吸引人的特点,它在函数表达能力、推广能力和学习效率上都要优于传统的人工神经网络。近十年来,Vapnik等人在统计学习理论SLT的基础上发展了SVM算法,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其它机器学习问题。很多学者认为,它41"JJE在成为继模式识别和神经网络研究之后机器学习领域中新的研究热点,并将推动机器学习理论和技术有重大的发展。SLT体系及其SVM算法在解决“小样本难题”过程中所取得的核函数应用等方面的突出进展令人鼓舞,已被认为是目前针对小样本统计估计和预

3、测学习的最佳理论。本课题基于支持向量机方法对电子邮件分类进行了研究和实现,主要包括以下内容:l、介绍电予邮件的相关理论。阐述了电子邮件的格式,其次分析了电子邮件的传输原理、相关协议和标准,并详细阐明了邮件分类的国内外研究现状,为本课题的全面开展奠定了基础。2、讨论了支持向量机的思想、方法、应用和特点以及国内外研究动态,分类问题。3、研究了文本分类的定义、评估方法。最后详细探讨了中文文本的分类过程:文本的表示、特征项的抽取以及文本的训练方法和分类方法。4、本文设计并初步实现了一个基于支持向量机的自动邮件分类系统。该系统位于邮件客户端,能对已有邮件样本进行自主学习,并自动从

4、邮件服务器接收新到邮件进行分类和垃圾过滤。论文的不足在于要对支持向量机做更深入的研究,并适当修改算法,以提高分类山东师范大学硕士学位论文速度,还要对特征词筛选方法进行系统研究,挑选出最适合邮件过滤的特征项选择方法,为提高分类效果需要广泛收集邮件样本进行训练。论文肯定还有许多不完善的地方,相关工作还有待进一步研究。关键词二电子郎件;支持向量机;分类;特征选择分类号:TP391,1山东师范大学硕士学位论文TheResearchofEmailClassificationBasedonSVMABSTRACTE-mailisthemostwidelyusedIntemetappl

5、ication,themostpopularnetworkfunctions.Withthepopularity‘ofinformationtechnology.Ithasnowevolvedintoamuchmorecomplexandrichsystemallowthetransmissionofvoice,pictures,i。mages,multimediafilesandotherinformation.ReportontheaccountsorevenifthedatabasecanbecirculatedontheIntemetinthe'formofe.

6、mailattachments.Now,e-mailhasbecomethelifebloodofmanybusinessesandorganizations.Userscarlmanageprojectthroughe—maildiscussions.Sometimesunderthefastortheexchangeofintercontinentale-mailmessageswemakeourdecisions.However,wi也allincreaseinthenumberofe-mail,howt‘oeffectiveclassifye-mailandfi

7、lteroutspambothersmanypeople.SupportVectorMachineisanewgenerationoflearningmachinesbasedonstatisticallearningtheory.Ithasmanyattractivefeaturesanditsabilityto:function,learningabilityandefl]ciencymnstbesuperior10thetraditionalartificialneuralnetworks.Thepast10years,Vapnik

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。