欢迎来到天天文库
浏览记录
ID:35230314
大小:410.50 KB
页数:21页
时间:2019-03-22
《邮件过滤需求规格说明书》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、文档编号版本号___1_______文档名称____需求规格说明书__________项目名称:_垃圾邮件过滤系统__________________项目负责人:___开发单位:_____软件工程大作业小组________________编写_________校对___________审核_____________2013____年____10____月_____13_____日1、引言1.1编写目的“邮件过滤系统”软件需求说明书主要为软件开发提供需求说明,在需求说明说中详细介绍本系统要达到什么样的要求以及基于什么样的硬件设备和软件平台来实现本软件系统的。此文档是参
2、与本软件的需求分析人员、开发人员、测试人员的参考依据,它明确规定了本软件的性能要求、设计需求以及所能达到的期望值,保证开发出高质量、有市场价值的软件。面向的读者:本系统软件的开发人员,测试人员,主要提供一些必要的参考给后续开发人员,从而让开发人员开发出的软件实现后能充分满足客户或用户的需求。1.2项目背景l本项目的任务提出者:高东发老师l项目开发者:林子豪、梁晓明、崔建鹏、吴清、张珊珊l垃圾邮件的危害:Ø占用网络资源Ø浪费服务器资源Ø增加用户处理时间Ø对网络安全形成危险Ø散步有害信息l电子邮件已成为日常生活中最流行,最方便,经济的通信手段。用户在收发邮件同时,经常受
3、到垃圾邮件的干扰。邮件的泛滥给互联网用户带来很多烦恼和侵害,也给社会带来了极大的负面影响。根据“中国互联网协会反垃圾中心”调查显示的数据如下:调查结果显示,截止2013年2月,中国邮箱用户平均每周所收到的垃圾邮件大约是35%,这些垃圾邮件不仅浪费我们阅读时间,而且大大影响了我们的身心健康。由此可见,过滤垃圾邮件迫在眉睫。l目前,国内研究的过滤技术主要是基于内容的过滤。基于内容的过滤具有较高的智能性和准确率,是一种较成熟的垃圾邮件过滤技术。但是这种方法仍然存在较大的问题以下这几个问题:Ø对中文邮件的误判率较高Ø目前过滤技术对垃圾词汇不易识别Ø对垃圾邮件概念不明确Ø对其
4、他语言邮件无法识别Ø无法适应日新月异的垃圾邮件伪装技术的进步l目前国内邮箱用户所收到的垃圾邮件内容状况如下:调查结果显示,截止2012年11月,邮箱用户所收到的垃圾邮件内容集中在“欺诈类”内容和“消费类”内容。这些内容或多或少干扰我们的判断,影响我们的理性,特别是对缺乏判断能力的未成年青少年造成巨大的危害。l垃圾邮件的语言种类繁多,以下的图表显示了垃圾邮件所使用的语言种类。通过对中国互联网用户所收取垃圾邮件的语言种类进行统计可以看出,“中文”、“英文”、“日文”这3类语言占用户收到垃圾邮件的前3位,如图所示。其中,中文垃圾邮件所占比例已经高达67.39%,而其他语言
5、所占比例总和仅32.61%。垃圾邮件具有很强的区域性,因此,在我国基于中文内容的垃圾邮件过滤方法研究需结合自身特点体现出较强的针对性。综合调查结果显示,不断加强垃圾邮件的过滤是一项非常重要、而且很有市场价值,但却十分艰巨的工作。1.3定义1.3.1垃圾邮件定义垃圾邮件(spam、junkmail):《中国互联网协会反垃圾邮件规范》将垃圾邮件被界定如下:Ø(l)收件人事先没有提出要求或者同意接收的广告、电子刊物以及各种形式的宣传品等宣传性的电子邮件。Ø(2)收件人无法拒收的电子邮件。Ø(3)隐藏发件人身份、地址、标题等信息的电子邮件。Ø(4)含有虚假的信息源、发件人、
6、路由等信息的电子邮件。1.3.2垃圾邮件定量描述根据上述垃圾邮件的定义,一封电子邮件是否是垃圾邮件可以用式子M=f(X,Y,Z)来衡量,M的初始值为0。其中x={x1,x2,…,…,},xi表示垃圾邮件的某一信头特征,各个xi之间是互相独立的变量。如果xi是垃圾邮件的明确特征,则表明这极有可能是一封垃圾邮件。例如xi为非法的邮件服务器地址,则置变量M为一较大值;如果xi不是垃圾邮件的明确特征,例如发送服务器的域名与发件人域名不同,则只能置M为一个很小的值。Y和Z分别为邮件标题。邮件正文和邮件附件经过垃圾邮件内容分析和计算后得到的这封邮件属于垃圾邮件的概率值。1.3.
7、3软件开发中出现的其它术语定义uE-mail(电子邮件):又称电子信箱、电子邮政,它是—种用电子手段提供信息交换的通信方式,是Internet应用最广的服务,通过网络的电子邮件系统,用户可以用非常低廉的价格(不管发送到哪里,都只需负担电话费和网费即可),以非常快速的方式(几秒钟之内可以发送到世界上任何你指定的目的地),与世界上任何一个角落的网络用户联系,这些电子邮件可以是文字、图像、声音等各种方式。同时,用户可以得到大量免费的新闻、专题邮件,并实现轻松的信息搜索。u贝叶斯分类算法:一类利用概率统计知识进行分类的算法1.4参考资料名称作者年份出处JAVA邮件开发详
此文档下载收益归作者所有