欢迎来到天天文库
浏览记录
ID:15943973
大小:565.00 KB
页数:11页
时间:2018-08-06
《基于数据挖掘的骚扰电话检测技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于数据挖掘的骚扰电话检测技术张一乾,马跃**(北京邮电大学计算机学院,北京100876)5101520253035摘要:骚扰电话是一种典型的电信欺诈行为,越来越多的用户受到它的影响。为了降低骚扰电话对用户的干扰,提升服务质量,各个运营商开始建设自己的骚扰电话监控平台。本文结合数据挖掘理论中的分类算法,研究骚扰电话的检测技术。在此基础上,选取贝叶斯算法建立了骚扰电话的检测模型,实现了通过通话记录数据对骚扰电话的判别,为运营商提供了参考。关键词:数据挖掘;骚扰电话;贝叶斯算法中图分类号:TP391.4Harassingphonecallsdetectiontechnolo
2、gybasedondataminingZhangYiqian,MaYue(ComputerScienceSchool,BeijingUniversityofPostsandTelecommunications,Beijing100876)Abstract:Harassingphonecallsisakindoftypicaltelecomfraud,moreandmoreusersareaffectedbyit.Inordertoreducetheinterferenceofharassingphonecallsandimprovethequalityofservice,t
3、heoperatorsstarttobuildtheirownharassingphonecallsmonitoringplatform.Thispaperdidsomeresearchonthedetectiontechnologyofharassingphonecallsthroughtheclassificationalgorithmindataminingtheory.Onthisbasis,thebayesianalgorithmhasbeenchosentoestablishaharassingphonecallsdetectmodel,whichachieve
4、sdiscriminationofharassingphonecallsthroughcalldetailrecord,makereferencefortheoperators.Keywords:datamining;harassingphonecalls;Bayesianalgorithm0引言随着移动通信服务的不断拓展,给用户和企业带来便利的同时,随之而来的也有新的困扰,一些非正常用户利用电话进行推销、骚扰等活动,给正常用户带来了非常大的影响。这些非正常用户对移动用户进行大范围的拨打,振铃一次后挂机。用户回拨这些用户时,呼转到音信台或录音电话,从而进行骚扰和欺诈行为。这
5、种在主观上违背手机用户意志并在客观上对用户通信自由、生活安宁造成侵害的呼叫被称为骚扰电话。这类骚扰电话损害了用户利益,对运营商也带来了很大的负面影响[1]。为了降低骚扰电话对用户的生活和工作的影响,解决用户关心的骚扰电话问题,提升业务服务水平和网络服务质量,建设骚扰电话监控平台是电信公司信息化建设的必然趋势。为提升骚扰电话疑似号码辨别的准确性,引入数据挖掘技术来判别骚扰电话疑似号码,并结合设备处理机制,进行骚扰电话的及时拦截,是骚扰电话检测和控制技术必然的发展趋势[2]。本文旨在结合数据挖掘理论来研究骚扰电话的检测技术,为运营商提供参考。40作者简介:张一乾(1989-),
6、男,硕士研究生,计算机网络与多媒体通信通信联系人:马跃(1961-),男,副教授,计算机网络、虚拟路由器技术.mayue@bupt.edu.cn-1-1数据挖掘中的分类方法概述本课题的目的是基于数据挖掘技术实现骚扰电话识别,这是数据挖掘理论中一个典型的分类问题。因此重点对数据挖掘技术中的分类方法以及各种具体分类技术进行了学习研究,以便选择合适的分类技术来解决骚扰电话识别问题。455055分类在数据挖掘中是一项非常重要的任务。在很多实际问题中,往往会给定几种分类,需要通过数据挖掘技术来判断具体数据属于哪一种分类[3]。对数据进行分类可以分为两个过程。第一步,学习过程,在这
7、个过程中要根据实际问题需求以及历史数据构造出分类器,即分类模型。该分类模型可以将数据项映射到给定类别之一。第二步,评估和分类过程,在这个过程中,使用检验数据对分类器的准确率进行评估,如果分类器的准确率可以接受,则可以使用分类器对未分类的数据进行分类。如果分类器的准确率过低,则需要重新构造分类器。例如,在骚扰电话识别问题中,将呼叫数据分为两类:骚扰电话和非骚扰电话,我们首先需要使用数据挖掘的分类技术构造分类器,然后使用检验数据对分类器的准确率进行评估,并使用通过评估的分类器对一个呼叫进行判别或预测,判别这个呼叫是否为
此文档下载收益归作者所有