多层支持向量机在垃圾短信过滤中的应用分析

多层支持向量机在垃圾短信过滤中的应用分析

ID:27052163

大小:1.19 MB

页数:81页

时间:2018-11-30

多层支持向量机在垃圾短信过滤中的应用分析_第1页
多层支持向量机在垃圾短信过滤中的应用分析_第2页
多层支持向量机在垃圾短信过滤中的应用分析_第3页
多层支持向量机在垃圾短信过滤中的应用分析_第4页
多层支持向量机在垃圾短信过滤中的应用分析_第5页
资源描述:

《多层支持向量机在垃圾短信过滤中的应用分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、-------河北工业大学硕士学位论文第一章绪论§1-1选题背景随着中国手机用户数量的迅猛增长,手机短信业务因其使用方便、价格便宜和随时随地收发等优点而在短时间内得到大面积普及。短信业务自2000年起在中国正式推广,现已获得爆炸性的增长,手机短信成为人们交流的一种新手段。国际电信联盟(ITU)表示,到今年年底全球手机用户总人数将达40亿,形成全球最大的移动电话市场。短信业务量也在迅速增长,从调查情况来看,几乎所有的手机用户都收到过垃圾信息,仅2007年,垃圾短信发送者每个季度的业务同比增长都达到25

2、0%以上,单个季度的营收高达1400万美元。这意味着,任由垃圾短信如此发展的结果就是,所有用户的手机都将成为手中的垃圾桶,用户将很难从中找到真正有用的信息。除此之外,还有更严重更令人震惊的问题。垃圾短信发送者不仅有全国2亿多用户的姓名、手机号,而且还进一步掌握了手机用户的职业、住址、收入甚至消费取向等等,分类划分定向发送,得意地称之为“指哪打哪”,其猖獗程度远远出乎人们的意料,对个人信息安全构成巨大威胁。对此,国家工商行政管理机关进行了权威发布,着手进行相关查处工作。垃圾短信不仅严重干扰了正常的信息

3、传递,还危害到了个人隐私。因此,垃圾短信已经成为一个世界性公害。所谓手机垃圾短信是指批量发送的内容违法或违规的短信,或违背手机用户主观意志接收到的并且在客观上对用户造成骚扰的短信[1]。现在电信运营商对于垃圾短信一般都是进行流量监控,也就是说经监控日发送流量大大超过正常发送量(一般群发短信的日发送量都在万条以上)的,不论短信内容是否违法将一律视为垃圾短信。现在没有哪个运营商能根据短信的内容来过滤垃圾短信[2]。中国通信协会增值专委会杨萍秘书长也指出,纵观3G应用很成熟的几个国家和地区,尤其是日本,他

4、们也曾经面临过垃圾短信的困扰,从他们的经验来看,单纯从政府和运营商的角度,很难找到根治的方法和规则。所以,一方面运营商可以在服务器上增强垃圾短信过滤功能,另一方面,手机用户要求手机生产商对手机产品设置垃圾短信的过滤功能。在这里研究的手机垃圾短信过滤是根据短信内容进行过滤的,它可以应用在运营商服务器端,当然也可以应用在用户手机端。目前,各国从立法的角度出发制订防范措施[3]。我国政府在2007年出台了SP代码调整和统一工作,工作的重要内容就是各个运营商统一使用一个SP服务代码——106,而短信代码的统

5、一主要目的就是消灭违规短信。这有效地治理了服务商所产生的垃圾短信,而对更广大的集团用户和个人用户所产生的垃圾短信依然缺乏有效地治理。为了维护人们的合法利益和使用方便,有效的过滤垃圾短信成为目前研究的一个热点。1-----------多层支持向量机在垃圾短信过滤中的应用研究§1-2研究内容垃圾短信过于泛滥对人们的生活造成了很恶劣的影响,尤其是以欺诈为目的的短信,社会和媒体对此已经有了很高的关注。经过对现有的垃圾短信过滤方法和知识的学习,发现了几个问题:(1)垃圾短信过滤端和过滤模型短信的传输方式简单来

6、说就是短信中心中转用户发送的短信,短信的过滤无非就在这两个端点了。那么,现有的短信过滤方法究竟适合在哪个端点呢,优点和缺点是什么,怎么样来更好的过滤呢?这是本文首先要研究的内容。(2)垃圾短信特征研究垃圾短信过滤的方法很多,但很多过滤方法都只重视技术本身的优劣,却忽略了对垃圾短信本身的研究。垃圾短信有哪些特征呢?经过研究注意到,一般来说,垃圾短信具有如下3个特点:①、短信内容相对较长(至少45个字符);②、垃圾短信在末尾处会有一个真实的电话号码信息,构成了一定的模式;③、以某种商品为载体,这些商品可

7、能是“地产”、“租房”、“文凭”、“假证”、“购物”、“彩铃”、“二手车”、“服装”、“服务”、“公关”等等。上述3个特点作为垃圾短信的重要属性,其地位和作用将远大于其它特征词属性。(3)传统支持向量机研究支持向量机过滤垃圾短信是目前比较具有优势的方法,但支持向量机本身存在一些问题:噪声数据和高维问题。需要对这些问题进行研究、改进,以提高过滤准确率。针对以上这些问题,本文首先研究短信传输方式,并分析了过滤模型和其优缺点。之后研究垃圾短信的特征,并研究传统支持向量机过滤垃圾短信的方法。在此基础上,提出

8、了多层支持向量机的理论,试图弥补传统支持向量机的缺点,提高分类准确率。多层支持向量机是本文重点研究的内容,包括理论的提出,理论的意义,以及应用多层支持向量机解决问题的方法。最后,将多层应用支持向量机应用于垃圾短信过滤中,进行实验、对比、分析,试图找到一个应用多层支持向量机来提高准确率的最优方法。§1-3论文组织本文第一章为绪论,主要介绍论文选题的背景,论文主要研究的方向和内容,以及论文整体的组织情况。第二章主要是对垃圾短信过滤基本知识的介绍和学习。本章首先介绍了短信的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。