基于最大熵方法的垃圾邮件过滤插件的设计与实现.doc

基于最大熵方法的垃圾邮件过滤插件的设计与实现.doc

ID:20752391

大小:76.40 KB

页数:10页

时间:2018-10-15

基于最大熵方法的垃圾邮件过滤插件的设计与实现.doc_第1页
基于最大熵方法的垃圾邮件过滤插件的设计与实现.doc_第2页
基于最大熵方法的垃圾邮件过滤插件的设计与实现.doc_第3页
基于最大熵方法的垃圾邮件过滤插件的设计与实现.doc_第4页
基于最大熵方法的垃圾邮件过滤插件的设计与实现.doc_第5页
资源描述:

《基于最大熵方法的垃圾邮件过滤插件的设计与实现.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于最大熵方法的垃圾邮件过滤插件的设计与实现摘要:结合邮件的半结构化特征,将最大熵模型引入垃圾邮件过滤中,构造出基于最大熵模型的垃圾邮件过滤系统框架。在此基础上,将其与Outlook提供的PIA相结合,利用.NET技术开发出基于最大熵模型的垃圾邮件过滤插件,在客户端实现了基于内容的垃圾邮件过滤,较好地解决了垃圾邮件的问题。关键词:最大嫡模型;邮件过滤;.NET;Outlook插件电子邮件以其方便、快捷、低成本等优点逐渐成为人们日常生活中主要的通信手段之一。但大量垃圾邮件的出现,给全球用户带来了巨大损失。据调查,我国用户平均每人每周收到的垃圾邮件数量占收到的总邮件

2、数量的%[1]。垃圾邮件的泛滥已带来严重后果,因此有效地区分正常邮件和垃圾邮件成为一项紧迫的任务。近年来,有关垃圾邮件过滤技术的研究逐渐兴起。常见的过滤方法有黑、白名单技术和规则过滤等,但由于邮件发送者在不断变化,规则难以维护,准确率不高,使这些方法都具有一定的局限性。将垃圾邮件过滤与机器学习、文本分类和信息过滤技术相结合,对邮件正文内容进行分析,已成为目前研究的热点[2]。最大熵模型是一种广泛应用于统计自然语言处理领域的技术。结合邮件的半结构化特性,本文将最大熵模型应用到垃圾邮件过滤中,构造出基于最大熵模型的垃圾邮件过滤系统框架,并将其与Outlook相结合,

3、基于.NET平台开发出了Outlook垃圾邮件过滤插件,在客户端利用最大嫡模型实现了基于内容的垃圾邮件过滤。1基于最大熵模型的垃圾邮件过滤1.1最大熵模型2.1互操作程序集.NET框架中提供的COMInterop技术,使开发人员可以在.NET代码中直接访问COM组件。其基本原理[4]是,针对用户要访问的COM组件,.NET框架自动生成一个互操作程序集。IA是一个完全的托管程序集,其命名空间、类、方法等都与COM组件相对应。这样,在.NET程序中可以直接引用IA,由IA完成对真正COM组件的访问2说明了IA的作用微软公司为Out1ookXX提供了一个“正式的”互操

4、作程序集,即主互操作程序集,驻留在名称为的全局程序集缓存中。在Outlook的安装过程中,选择NET可编程性支持”,或者下载客户端PIA安装包来完成PIA的安装[5]。2.20utlookXX对象模型Outlook通过对象和对象集合的层次系统为开发语言提供功能,开发人员利用可用的对象和功能与Outlook进行交互,创建自己的解决方案。下面对其中几个重要的对象进行介绍[6]。2.2.lApplication对象Application是层次结构中所有其他对象的根,提供对其他所有Outlook对象的访问。要从外部应用程序中访问Outlook对象模型,必须先获得Appl

5、ication对象的实例。2.2.2Namespace对象Namespace对象是Outlook数据源的抽象根。如果要访问Outlook数据,则必须创建Namespace对象的实例。目前,所支持的唯一数据源是邮件应用程序编程接口MAPI,用于访问Outlook文件夹组中的所有Outlook数据。2.2.3MAPIFolder对象Outlook数据存储区内有一组支持默认功能的文件夹,使用Namespace的GetDefaultFolder()方法返回某个默认文件夹,即MAPIFolder对象。2.2.4Items对象Items代表Outlook项目集合,如邮件项目

6、Mailitem、任务项目Taskltem等。可以使用Application对象的CreatEitemO创建新的项目或使用Items对象的索引器获得并修改现有的项目。2.2.5Explorers和Inspectors对象Outlook对象模型还定义了用来对用户界面进行操作的类型。Explorers对象包含一组Explorer对象,代表所有的浏览器。Explorer类型表示用于显示文件夹内容的窗口。Inspectors对象包含一组Inspector对象,代表所有检查器。Inspector对象代表显示0utlook项目的窗口。2.3用.NET开发Outlook插件利

7、用PIA,开发人员可以在.NET中方便地对Outlook的编程接口进行操作[7]。VisualH提供了“共享的外接程序”项目模板,通过创建自定义外接程序,对OutlookXX进行功能扩展。完成共享的外接程序向导后,得到包含两个项目的解决方案,即外接程序项目和对应的安装项目。外接程序自动引用程序集。它包含命名空间Extensibility。其中确切定义了三个类型:IDTExtensibility2所有外接程序都必须实现的关键接口;ext_ConnectMode枚举变量,表示将宿主程序连接到外接程序的各种方式;ext_DisconnectMode枚举变量,表示将外接

8、程序与宿主程序断开的各种

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。