欢迎来到天天文库
浏览记录
ID:34190975
大小:4.81 MB
页数:64页
时间:2019-03-04
《基于分类及相似性图像型垃圾邮件检测技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、南京邮电大学硕士学位论文基于分类及相似性的图像型垃圾邮件检测技术研究姓名:杨波申请学位级别:硕士专业:计算机软件与理论指导教师:张卫丰2011-03南京邮电大学硕士研究生学位论文摘要摘要随着网络和信息技术的发展,电子邮件已经成为人们沟通交流的重要工具。但是垃圾邮件的泛滥却给人们的工作和生活带来了极大的困扰。尤其从2005年开始,垃圾邮件制造者将垃圾信息嵌入到图像中,并在图像中加入噪声或模糊化等技术,形成了图像型垃圾邮件(imagespam),以逃避反垃圾邮件系统的检测,因此如何精确和高效的检测图像型垃圾邮件是急需解决的问题。论文系统地分析了
2、imagespam的产生背景、发展现状及研究意义,对图像型垃圾邮件检测的关键技术进行深入的学习和研究,并在已有研究成果的基础上,提出了基于分类和相似性的图像型垃圾邮件的检测方法。论文主要完成了以下几方面的创新:1.分析了垃圾邮件检测技术使用的各种图像特征,提出了利用图片的局部不变特征来描述图片的垃圾信息分布的方法。2.针对imagespam的多种构造方法,提出了基于垃圾技术分类的垃圾邮件检测方法,该方法构建两层的组合过滤器,第一层是检测图片中的噪声特征过滤器,第二层是颜色特征、纹理特征、形状特征的组合过滤器。实验证明这种分层组合的过滤器具有
3、较高的召回率。3.针对传统的基于相似性的imagespam检测系统的不足,提出了利用加速的健壮特征SURF算法提取图片的局部不变特征,训练高斯混合模型GMM的分类器来检测图像型垃圾邮件的方法。论文通过实验证明,在图像型垃圾邮件的检测中,基于图片的局部不变特征的GMM分类算法比其他算法具有更好的检测效果。关键词:垃圾图像;特征提取;局部不变特征;图像过滤器;高斯混合模型I南京邮电大学硕士研究生学位论文AbstractAbstractAlongwiththedevelopmentofthenetworksandinformationtechno
4、logy,theemailhasbecomethemostimportantmeanforpeopletocommunication.Howeverthefloodingofspamhasledtotremendousinconveniencetothepeople’slife.Especiallystartingfrom2005,thespammakersembedspaminformationintographicalimageswiththetechnologyofnoiseadding、fuzzificationandsoon,th
5、ustheimagespamcomesintobeing.Howtodetectimagespamaccuratelyandefficientlyisanurgentproblem.Thispaperanalysesthebackground、developmentactualitiesandsignificanceofthestudiesonimagespamsystematically,studiesthekeytechnologyofimagespamdeeply.Thepaperputforththeimagespamdetecti
6、ngmethodbasedontheclassificationandnear-duplication.Thefollowingarethemaininnovationofthispaper:1.Analyzingthevariouscharacteristicsofimageinspamdetecting,puttingforwardthemethodofusinglocalinvariantfeaturestodescribethedistributionofspaminformation.2.Puttingforththespamde
7、tectingmethodbasedonclassificationsincethevariousimagespamconstructionways.Themethodisconstructedbytwocombinedfilters,thefirstisthefilterbasedonthenoisefeaturesextractinginimages,theotheristhecombinedfilterofcolor、textureandshapecharacteristic.Theexperimentsshowthiscombine
8、dfilterhasveryhighrecall.3.Totheshortcomingofthetraditionalimagespamdetectingsystem,weuse
此文档下载收益归作者所有