欢迎来到天天文库
浏览记录
ID:35140233
大小:4.92 MB
页数:142页
时间:2019-03-20
《浅论反垃圾邮件技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、电子科技大学博士学位论文反垃圾邮件技术的研究姓名:詹川申请学位级别:博士专业:计算机系统结构指导教师:卢显良20050601电子科技大学博士学位论文摘要伴随着工nternet的普及,电子邮件以其快捷、方便、低成本的特点已成为互联网上最重要、最普及的应用.但是随之而来的垃圾邮件也越来越泛滥,占用了有限的存储、计算和网络资源,耗费了用户大量的处理时间,影响和干扰了用户的正常工作,生活和学习。如何有效地治理垃圾邮件问题是全世界共同面临的一道难题,也是互联网上目前急待解决的问题。本文从技术的角度出发,在全面系统学习和总结了国内
2、外反垃圾邮件领域的最新成果的基础上,深入细致地研究了反垃圾邮件技术,取得了以下若干创新和成果。本文的主要创新和贡献包括:1、归纳总结了当前垃圾邮件采用的新的抗过滤的方法和手段。垃圾邮件发送者为了让垃圾邮件逃避各种垃圾邮件过滤,不断变化更新欺骗过滤器的方法和手段,目前简单的过滤方法已经无法有效地过滤垃圾邮件。本文在学习了国内外相关资料和研究了大量近期垃圾邮件样本后,归纳总结了当前垃圾邮件发送者常采用的欺骗手段和方法,及其它们的特点,以便有的放矢,更有效地反垃圾邮件。2,提出了一种基于内容的MNNB垃圾邮件过滤算法。MNN
3、B算法应用Markov链改替了NaiveBayes垃圾邮件过滤算法中的词条之间相互独立的缺陷,并假设句与句之间是独立的,来简化算法的计算量。实验显示MNNB算法提高了NaiveBayes算法的准确率和查全率,并且由于该算法不需要分词,对过滤不同语言的垃圾邮件具有更好的适应性。3,提出了一种基于内容的LVQ神经网络过滤算法。LVQ神经网络算法是先把邮件细分成具体的类别,然后再根据用户的定义,把具体的类别规约成垃圾类邮件和正常类邮件。LVQ神经网络算法克服了垃圾邮件具体类别宽泛,特征离散的问题,提高了垃圾邮件识别的准确度,
4、并且该算法可根据用电子科技大学博士学位论文户对垃圾邮件范围的不同定义,来划分垃圾邮件和正常邮件。4、提出了一种基于特征的近似垃圾邮件检测算法-ASD算法。针对网络中存在大量重复、近似的垃圾邮件,利用ASD算法生成的特征,高效地查询收到邮件。ASD算法以句为单位,作为SHAI函数的参数,计算其哈希值,然后将获得的哈希值排序,生成每个己知垃圾邮件的特征。比较新邮件的特征与己知垃圾邮件特征的近似度,来判断该邮件是否为垃圾邮件。5、构建了一个基于URL垃圾邮件快速过滤的模块。当前相当一部分垃圾邮件简单地给出某“黑网页”的URL
5、地址,起到间接宣传广告的作用,而能有效的逃过现有的垃圾邮件过滤方法的过滤。针对此类垃圾邮件,采用基于URL的过滤,能有效过滤此类垃圾邮件,是其它垃圾邮件过滤算法的有效补充。6、构建了一个基于邮件服务器端的、多层次的垃圾邮件过滤系统—SpamSweeperoSpamSweeper系统集合了DNS反向查询、公有、私有黑白名单、询问/响应、基于URL的过滤、基于特征的ASD算法、基于内容的LUQ神经网络算法和MNNB算法多种方法,各种方法之间相互协作、互相补充,形成一个准确、快速、高效、易管理和满足不同个性化要求的反垃圾邮件
6、过滤系统。关键词:垃圾邮件,过滤,贝叶斯算法,学习向量量化网络,特征电子科技大学博士学位论文AbstractWiththerapiddevelopmentofinternet,thetechnologyofemailiswidelyusedinpeople'sdailylife.However,theoccurrenceofmoreandmorespamemailsisannoyingtouser,whichcausesthegreatwasteofuser'stime,moneyaswellasnetworkband
7、width.Andwhat'sworst,itcanbeharmfultousers.Forexample,pornographiccontentmaybecontainedinspamemail.Therefore,itisveryimportanttoresolvetheproblemofspamemails.Basedonthesystematicsummarizationofthemostrecentworkonanti-spam,thisdissertationexploresthetechniquesofa
8、nti-spamemail.Throughtheauthor'sefort,someinnovationsandachievementsaremadebytheauthor,whichwillbeillustratedindetailasfollows.Thebreakthroughofthisdissertationcouldb
此文档下载收益归作者所有