基于混合高斯模型的电子邮件多过滤器融合方法

基于混合高斯模型的电子邮件多过滤器融合方法

ID:33548812

大小:411.31 KB

页数:10页

时间:2019-02-27

基于混合高斯模型的电子邮件多过滤器融合方法_第1页
基于混合高斯模型的电子邮件多过滤器融合方法_第2页
基于混合高斯模型的电子邮件多过滤器融合方法_第3页
基于混合高斯模型的电子邮件多过滤器融合方法_第4页
基于混合高斯模型的电子邮件多过滤器融合方法_第5页
资源描述:

《基于混合高斯模型的电子邮件多过滤器融合方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第!期电!!子!!学!!报./0123!+/1!!!!""#年!月$%&$’(’%&)*+,%$-,+,%$4561!!""#基于混合高斯模型的电子邮件多过滤器融合方法李文斌7!!!刘椿年7!陈嶷瑛!!78北京工业大学多媒体与智能软件北京重点实验室"北京7"""!!#!8石家庄经济学院信息工程学院"河北石家庄"9""27$!!摘!要!!本文提出了一种基于混合高斯模型!:;;$的多贝叶斯过滤器融合方法"并成功应用于电子邮件过滤1该方法使用多元统计分析方法对多个过滤器在训练例上的过滤表现矩阵进行降维和

2、除噪"得到训练数据及各过滤器的分布#然后"从这一分布中学习出对邮件进行类别判定的:;;1:;;根据期望代价最小准则进行过滤"避免将正常邮件判定为垃圾1实验结果表明"本文方法具有较好的过滤性能"且对于特征提取率的敏感度低1关键词!!代价敏感#邮件过滤#混合高斯模型#过滤器融合中图分类号!!&<7=7!!!文献标识码!!$!!!文章编号!!"2>!?!77!!!""#$"!?"!3>?"9!"#$%&%&’()*+%,*-.#/%*0%*+-12"34/56-7/8-27/2-9"&:((7"!"(,

3、C%DEA?ABFA7"%G’+HB?IBAJ!(,@5A?6BA!7!"#$%&’()&**+),+%($$&-(+%./0%1*2(3(&4&+-5(67*8!"3(&4&+-9+&:(2;&%6/0<(=>+/$/-6"3(&4&+-7"""!!"?>&+*#!!.=>//$/0,+0/2’*%&/+@+-&+((2".>&4&*A>#*+-9+&:(2;&%6/0@=/+/’&=;".>&4&*A>#*+-"B(8(&"9""27"?>&+*$;$2+1/<+%!$AF0J/KBLDMN/

4、M6BABAJME0LBO05+FPQ5RFI5SBFA!+R$TB0L5KS6FS5U/A:;;BSOK5S5AL5U"VDBNDDFS655ASENN5SSTE00IFOO0B5UL/5?MFB0TB0L5KBAJ1&D5M5LD/UES5SLD5ME0LBO05QFKBFL5SSLFLBSLBNSFAF0ISBSL/M/U50LD5K50FLB/ASDBO65LV55ALD5LKFBABAJUFLFS5LFAULD5BKN0FSSBTBNFLB/A6IFN/005NLB/A/T+RTB0L5

5、KS1&D5AF:;;NFA6505FKA5UTK/MLD5K5SE0LBAJK5OK5S5ALFLB/A1&D5:;;TB0L5KSOK5QB/ES0IEAS55A5?MFB0SFN?N/KUBAJL/LD5OKBANBO05/TMBABMBWBAJ5XO5NL5U?5KK/K?N/SL"BA/KU5KL/FQ/BUU505LBAJES5TE05?MFB0S1’XO5KBM5A?LF0K5SE0LSN/ATBKMLD5QF0BUBLI/T/EKM5LD/U"FAUSD/VLDFL/EKFOOK/

6、FNDBSBAS5ASBLBQ5L/KFLB//TT5FLEK5SE6S5LS505NLB/A1=-8>"192%!N/SL?S5ASBLBQ5#5?MFB0TB0L5K#:;;#N/M6BAJME0LBO05TB0L5KS难的1近年来"更流行的做法是融合多个分类器"这样既能!!引言降低对单分类器性能最优的苛刻要求"又能较容易地得到高性能的识别系统&3’!!由于-;&<协议的缺限"邮件系统不对发件人身份1进行认证便可以发送或转发邮件"导致因特网上大量垃圾RFJJBAJ*R//SLBAJ*神经网络集

7、成*基于证据理论的电子邮件!以下简称为垃圾$的泛滥1因此"研究如何有效集成*选举法!./L5$等方法可以用于对多个分类器进行地过滤垃圾已成为热点1融合"文献&3"9’对这些方法作了介绍1遗憾的是"这些方目前"许多邮件客户端采用基于规则或关键字的方法法不能直接用于组合过滤邮件的分类器"原因在于%邮件过滤垃圾"这类方法的最大缺点是要求用户手动构造规过滤是代价敏感的分类问题"即将垃圾误分为非垃圾!以则1尽管研究人员提出了自动学习过滤规则的方法"但由下称为误收$和将非垃圾误分为垃圾!以下称为误拒$的代于垃

8、圾制造者经常变换关键词"使这一方法的过滤效果捉价是不同的"而已有的融合方法通常用在非代价敏感的分磨不定1类场合下1这里所说的代价"通常指的是时间花费*可能的文献&7"!’等使用机器学习的办法过滤垃圾1该类方财产损失*或对工作带来的不便程度等方面1法的基本思路是从本质上将邮件过滤视为文本分类问本文的研究重点主要集中在两个方面%研究对朴素贝题&2’"使用文本分类器将邮件分为(垃圾)和(非垃圾)两叶斯过滤器进行融合的方法#研究实现代价敏感的过滤器类1其做法是%首先进行最优的特征提取"然后

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。