基于分段、聚类和时序关联分析的用户行为分析.pdf

基于分段、聚类和时序关联分析的用户行为分析.pdf

ID:55932761

大小:535.22 KB

页数:6页

时间:2020-06-16

基于分段、聚类和时序关联分析的用户行为分析.pdf_第1页
基于分段、聚类和时序关联分析的用户行为分析.pdf_第2页
基于分段、聚类和时序关联分析的用户行为分析.pdf_第3页
基于分段、聚类和时序关联分析的用户行为分析.pdf_第4页
基于分段、聚类和时序关联分析的用户行为分析.pdf_第5页
资源描述:

《基于分段、聚类和时序关联分析的用户行为分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第31卷第2期计算机应用研究V01.31No.22014年2月ApplicationResearchofComputersFeb.2014基于分段、聚类和时序关联分析的用户行为分析常慧君,单洪,满毅(电子工程学院网络系,合肥230037)摘要:分析用户行为对网络用户的管理控制有着重要意义。用户行为实质上是一系列的数据交换过程,最终会体现为业务流,且这些业务流在时间上表现出一定的规律性。通过研究业务流的时序关系来分析用户行为的规律,提出一种用户行为的分析方法。该方法分为三个阶段,分别基于分形模型、改进的最大距离聚类法和Apfiofi算法进行分段、聚类和时序分析,最终从用户

2、的数据交换中获知用户的行为规律。实验表明,该方法在无法获知用户消息的具体内容的前提下,仍能较为准确地区分各类报文序列,并能有效发现用户信息发送行为的规律。关键词:分段;最大距离聚类;Apfiofi算法中图分类号:TP393文献标志码:A文章编号:1001—3695(2014)02—0526-06doi:10.3969/j.issn.1001-3695.2014.02.049Userbehavioranalysisbasedonsegmentation,clusteringandtimingrelationshipanalysisCHANGHui-jun,SHANHong

3、,MANYi(Dept.ofComputerNetwork,ElectronicEngineeringInstitution,Hefei230037,China)Abstract:AnalyzingtheuserbehavioriSofgreatimportancetothemanagementandcontrolOfnetworkusers.Userbehavior,whichisactuallySsetofdataexchanges,isuhimatelydisplayedastrafficflow,showingregularityalongtime.Thispa

4、perex—ploredthisregularitythroughstudyingthetimingrelationshipbetweentrafficflows,andproposedanoveluserbehavioranalysismethod.Theproposedmethodutilizedthreesteps,whichwerebasedonfraetalmodel,improvedmaximumdistanceclusteringmethod,andApriorialgorithmforsegmentation,clustering,andtimingan

5、alysis,respectively,toobtaintheuserbehaviorreg-ularityfromuserdataexchange.Theoreticanalysisandsimulationresultsillustratethatthismethodcansatisfactorilyclassifythepacketsequenceanddiscovertheregularityofusertransmitbehaviorwithoutdecryptinguserinformation.Keywords:segmentation;max—dista

6、nceclustering;Apriorialgorithm资源分配和管理提供依据,这类研究的已知信息是在某个时间0引言点或时间段内的流量、查询量或数据量等统计量,在分析单个用户的行为特征时不能有效发挥作用;基于聚类的方法如文献本文提出一种可用于用户异常行为发现的业务流时序分[4~6]根据用户的访问偏好等特性对用户进行分类,主要用析方法。该方法简单、易实现,且不会产生大量通信,具体实施于营销领域,也可能被用来实现针对用户的认知欺骗攻击;基是在网络中布置监测代理,所有的代理可以监测整个网络的信于关联分析的方法如文献[7~9]分析了网络用户的访问偏好息交换,并在代理上运行如

7、下算法:首先依据时间间隔和报文与位置和时间等因素的关系,可以用于对单个用户行为的预长度信息对用户的信息发送报文序列进行分段,然后依据其包长分布、时间间隔分布、段长度等统计特性对这些序列段进行测。以上方法都假设网络用户的身份、地址和所发的数据内容聚类分析,最后用Apriori算法对各类序列段进行时序关联分等信息已知。当用户对自身的数据内容进行加密时,这些方法析,时序分析的结果可以用来进行用户异常行为的分析。将不再适用。而为了保证通信内容的完整性和机密性,目前很用户行为分析是指用某些特征量的统计特征或特征量的多用户业务都采用了端到端加密机制,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。