欢迎来到天天文库
浏览记录
ID:37030945
大小:3.32 MB
页数:69页
时间:2019-05-20
《基于内容的图像垃圾邮件过滤技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中国科学技术大学硕士学位论文基于内容的图像垃圾邮件过滤技术研究姓名:刘芬申请学位级别:硕士专业:模式识别与智能系统指导教师:帅建梅20100501摘要电子邮件的广泛应用在给人们的沟通带来便利的同时,其副产品——垃圾邮件,也给人们的工作生活带来了极大的困扰。大量的垃圾邮件不仅浪费了我们的时间和精力,同时一些包含病毒、木马的垃圾邮件有可能给我们的网络与计算机系统的安全带来极大威胁。自20世纪90年代以来国内外学者进行了大量的研究,并先后提出一些文本垃圾邮件过滤的解决方案。为了规避过滤机制,越来越多的垃圾邮件将目的消息嵌入到图像中,出现了图像垃圾邮件(简称I-spam)。根据赛门铁克
2、的垃圾邮件现状报告,到2009年5月初图像垃圾邮件已经占到了所有垃圾邮件的20%。因此图像垃圾邮件的过滤显得尤为重要。本文针对垃圾邮件图像与正常邮件图像的差异性,提出了基于内容的图像垃圾邮件过滤方法,并以此为基础设计了分层组合式图像垃圾邮件过滤系统,实现对图像垃圾邮件的过滤。本文的贡献主要在以下几个方面:(1)分析了图像的各种基本特征,提出利用梯度和梯度方向特征实现图像垃圾邮件的过滤。与基本的颜色特征以及元数据特征相比,图像的梯度和梯度方向能够很好的反映图像中对象灰度变化情况,通过实验证明这两个特征具有比较高的识别率。(2)利用了分层组合式的图像垃圾邮件过滤系统,采用特征级的组
3、合方式和过滤器级的组合方式,同类特征使用特征级组合,不同类特征使用过滤器级组合。实验证明本文提出的方法既能够避免过度拟合,又能够充分利用不同特征训练的过滤器的优点,达到了较高的识别率。(3)将LS.SVM算法应用到图像垃圾邮件的过滤中。LS.SVM算法是SVM的一种改进算法,已经被应用到回归、分类等多个领域并且其性能要优于SVM算法。本文通过实验证明在图像垃圾邮件过滤中LS.SVM算法比其他算法具有更好的效果。关键词:图像垃圾邮件特征提取LS.SVM垒璺!!坠竺!ABSTRACTWidelyusedemailcommunicationsbringpeopleconvenienc
4、e,andthesametime,itSby-products—spamemail,givespeopleatroubledlivesandwork.Alotofspamnotonlywastepeople’Stimeandenergy,butalso,someemailsthatcontainingvirusesandTrojans,aremorelikelytobringagreatthreattopeople’Snetworkandcomputersystemsecurity.Sincethe20thcentury,90s,scholarsathomeandabroadh
5、avedonealotofresearch,andsometext-basedspamfilteringsolutionshavebeenproposed.Inordertocircumventthefilteringmechanism,anincreasingnumberofspamemailscontainedtheembeddedimages,thosewereSOcalledimagespam(calledI-spam).AccordingtoSymantec’Sstatusspamreport,InMay2009,imagespamaccountedforabout2
6、0%ofallspam.Imagespamfilteringisveryimportant.Inthispaper,consideringthedifferencesbetweenthespamimagesandthenormalimages,weproposedcontent—basedimagespamfilteringmethod,anddesignedahierarchicalcombinationimagespamfilteringsystemtorealizetheimagespam.Thecontributionofthispapermainlyislistedf
7、ollowing:(1)Inthispaper,weanalyzedsometypesofimagefeatures.Applingthegradientandgradientdirectionfeaturestoimagespamfiltering.ThesetwofeaturesofimagesCanreflecttheobjects’graylevelchanges.Theexperimentprovedthatthesetwofeatureshaveahigherrecognitio
此文档下载收益归作者所有