一种高效垃圾短信过滤系统的实现

一种高效垃圾短信过滤系统的实现

ID:37503611

大小:366.03 KB

页数:7页

时间:2019-05-24

一种高效垃圾短信过滤系统的实现_第1页
一种高效垃圾短信过滤系统的实现_第2页
一种高效垃圾短信过滤系统的实现_第3页
一种高效垃圾短信过滤系统的实现_第4页
一种高效垃圾短信过滤系统的实现_第5页
资源描述:

《一种高效垃圾短信过滤系统的实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、维普资讯http://www.cqvip.com究与开发一种高效垃圾短信过滤系统的实现黄文良’,陈纯,罗云彬’(1.中国联合通信有限公司北京100032;2.浙江大学杭州310027)本文提出了一种适用于对互联网发送的垃圾短信进行监控和过滤的解决方案,该方案根据短信日发送频度、短信内容、短信长度等特征,采用模糊匹配和频度监控相结合的方法进行短信监控和过滤。系统中创新性地提出了内容预变换、关键字加权控制频度等方法,相比传统方法而言,本系统在过滤准确度和误判率两方面的指标均获得大幅度提升。该系统中的短信模块具有高效、方便、实用等诸多优1应用背景点,在浙江吸引了大量用户使用,每月带来的短

2、信业务量中国联通浙江分公司(简称“浙江联通”)推出的“由你达上千万条,为浙江联通带来了可观的经济效益。但在业商务助理”系统是面向企业和个人用户的网上营业厅专业务开展的初期,也有部分不法分子以及不良SP.利用该系版。其内部集成了自助服务(话费查询、余额查询、账单查统的开放性和方便性,通过该系统群发大量非法信息,造询、详单查询、充值等)、广告发布、通信录管理、短信收藏、成了不良的社会影响。引起了用户的投诉。因而。必须对这信息发布等功能。“由你商务助理”系统的网络结构如图1些垃圾短信进行监控和过滤。所示垃圾短信的问题并不是“由你商务助理”系统所特有的.根据中国互联网协会发布的调查结果显示

3、,我国手机用户平均每周收到8.29条垃圾短信【11。目前,我国的手机用户数已经超过54z,。根据上述调查结果可知,全国用户每天收到的垃圾短信即可达5亿条以上。事实上,各种短信网关、短信中心(SMSC)均建有垃圾短信监控和过滤模块,但是由于大部分垃圾短信监控和过滤系统都是针对通过信令系统发送短信的手机发送的垃圾短信,无法针对来自短消息实体的短信进行监控和过滤。同时。由于受到短信中心处理速度的图1“由你商务助理”系统结构维普资讯http://www.cqvip.com研究与开发影响.基于短信中心的垃圾短信监控和过滤系统往往功能容(关键字)主要依靠人工添加的方法来实现,尚无法实现简单,效

4、果不理想。自动添加。号码黑名单的生成方式可分为手工添加、实时因此.在对大量垃圾短信样本进行分析,并对当前不自动生成和准实时自动生成等;号码白名单主要通过手工法分子逃避垃圾短信监控的手段进行跟踪后,“由你商务添加的方法来实现。下面简要说明这两种机制的实现原理助理”系统中的垃圾短信监控和过滤系统采用了全新的过和特点以及不足的地方。滤算法,创新性地提出了对短信内容进行预处理并结合关(1)内容关键字过滤机制键字加权控制发送频度等方法,有效地提高了垃圾短信监内容关键字过滤机制又可分为两种情况。一种情况是控和过滤的精确度,降低了垃圾短信的误判率。短信中心(SMSC)直接把接收到的短信内容与SM

5、SC的关键字列表进行匹配.如果短信中存在列表中的任一关键2垃圾短信现状分析及其相关对策字,则禁止下发该短信。另一种情况是短信中心接收到短2.1垃圾短信内容分类消息后,发送一个鉴权请求消息到监控系统,监控系统对根据系统运行时客服中心对用户收到的垃圾短信进短信内容进行判断,返回给短信中心鉴权响应消息,若短行的分类统计,结果显示(见图2):垃圾短信类型中以商信内容合法,则返回鉴权成功消息,短信中心将该短信下品广告、服务类的短信居多,占到了67.7%;其次是骚扰的发给接收方;若内容不合法,则返回鉴权失败消息,短信中黄色垃圾短信,占20-3%;诈骗、欺骗类短信占12%。心将禁止下发该短信。前

6、一种情况主要用来预防商业广告在广告类短信中,以推销新产品和服务、商场开业为性质的垃圾短信.后一种情况主要用来预防政治类和淫秽内容的占35.84%,;其次是代开发票,代办车牌以及各类色情类的短信。证件发放,占31.98%;再次是倒卖黑车、枪支弹药、高利贷内容关键字过滤机制的优点在于其原理和实现方式等短信,比例为18.19%。在欺诈、欺骗类短信中,以手机号都较为简单,应用成本较低。但该机制存在一些重大的局码中奖和银行卡诈骗为主,分别占47.43%和26.37%。随限性:一是关键字选取难度很大,仅通过关键字匹配很难着运营商监管力度的变化.各类垃圾短信的比例也会发生判断出短信的内容合法性,

7、因此很容易造成误判;二是不相应的变化。法分子很容易通过各种方法绕过关键字列表,对此类短信另外根据10010客服投诉以及对短信中心垃圾短信而言,关键字过滤机制形同虚设。过滤Et志的分析,除了上述短信外,一些不法SP的诱骗业例如,在对大量垃圾短信日志进行分析后发现,不法务定制短信以及涉黄语音信息台的色情宣传短信也非常分子常用的手段有以下几种多。除此之外,部分国家规定的信息也属于过滤之列,如涉·同音字替换——比如用“发轮功”代替“法轮功”.及政治敏感内容等。“兴爱”代替“性

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。