一种有效的基于生活熵的移动用户分类算法

一种有效的基于生活熵的移动用户分类算法

ID:38210100

大小:635.08 KB

页数:6页

时间:2019-06-02

一种有效的基于生活熵的移动用户分类算法_第1页
一种有效的基于生活熵的移动用户分类算法_第2页
一种有效的基于生活熵的移动用户分类算法_第3页
一种有效的基于生活熵的移动用户分类算法_第4页
一种有效的基于生活熵的移动用户分类算法_第5页
资源描述:

《一种有效的基于生活熵的移动用户分类算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、计算机研究与发展一一一,一种有效的基于生活嫡的移动用户分类算法谭钧元宋国杰谢昆青黄顺平北京大学信息科学技术学院北京北京大学机器感知与智能教育部重点实验室北京,,,,夕,了少夕山,夕,二,夕少,,摘要从海量移动用户通话记录中,根据用户的行为模式对用户进行分类挖掘主要贡献包括提出了生活墒的概念,用以刻画移动用户行为的规律性提出基于生活嫡的个人用户行为的分类算法,可在大量真实移动数据集上进行了实验分析利用本文提出的方法以有效的根据用户的行为特征对移动,面有较大的应用前景用户进行分类在移动客户分析方关键词序列挖掘距离聚类生活嫡移动用户行为模式中图法分类号,

2、,要基础设施在该随着移动通信技术迅猛发展和广泛应用在移环境中对用户移动行为的分析具动计算环境积累了海量的、动态变化的移动用户时有着重要的理论研究价值和现实应用意义,空行,本文研究的重点是移动用户行为的分类问题为数据对这些数据进行挖掘可以有效地发现、,是诸多移动行为模式分析如移动用户的行为细分用户移动的规律性即移动模式移动用户移动行为,分析在移动通信网络规划设计、移动性管理以及基用户的发现等的基础然而传统已有的研究一,于,多采用的是仿真出来的细时空粒度的数据〔』与实位置管理的服务领域都有重要意义除此之外在‘」和,际移动运营商采集的详细通话记录数据有智

3、能交通领域的发现交通参数获取在,社会网络分析领域的人际关系推断圈和个人行为预着重要区别原始数据是粗时间粒度且是近,,测冈以及定位犯罪发生区域〔〕等方面都有着广泛应似的位置信息具有随机性和稀疏性等特点不能支、,,持用户行为轨迹的直接连续的刻画描述所以以用因此移动通信网络已经成为国民经济发展的重一一收稿日期墓金项目国家自然科学基金项目,计算机研究与发展,增刊数据进行个人行为的挖掘更富有挑战虽然存础〔’〕,,在少量使用移动计费记录的研究但它们只是把根据上述问题定义算法把个人通话详细记,,数据作简单的综合没有更深人地分析个人移动模录转换成个人单天时段移动序

4、列然后再累计成个人多天时段移动序列,式,针对数据的特点和现有研究的不足本文算法实现了从原始海量数据中完成个人时段序列输人天经过数据清洗和数据提取的数据,输的提取并提出了对移动用户行为进行分类的算法出个人多天时段移动序列本文主要贡献可以归纳为①一。提出数据预处理算法对原始数据记录②进,行预处理完成从数据到时段移动序列的转③的用户不在中,,换为分类作好数据准备④一最后的标号创建“”提出了移动用户生活嫡的概念和计算方,,法实现了对移动用户移动行为规律程度的刻画并,⑤令取出并得提出了基于生活嫡的移动用户分类算法到,,在大量真实的数据集基础上对所提⑥把通话记

5、录的基站信息插人到剐吸,中出,的方法进行了实验验证证明了方法的有效性⑦本,文安排如下首先是数据准备和问题定义接⑧,下来提出了生活嫡的概念和计算方法并对移动用⑨一户的进行分类最后是实验验证和总结一⑩⑧数据准备与问题定义在算法实现中有如下的优化技巧出于时间效率考,虑采用映射结构寻找通话详细记录反映的是移动用户行为中是否存在某一个用户出于空间效率考,,的片段只有当用户通话时才会产生用户序列模式,几认,以基站标识,虑对中的基站信息出现次挖掘需要把这些片段信息转换为序列数据集数的二元组进行存放定义单天移动序列用户一天的例假设有如表所示的数据集记录按时间先后顺

6、序得到的序列可表示如下,,,‘一批吸,⋯,几恨了表数据识其,,会是用户通话时间所在位置中,是第天用户的移动序列第天用户的第个通话记录,,,在记录中的时间粒度低秒级对,分析用户行为来说太细以小时作为时段单位把,分成个组把会按照时段进行投影定义单天时段移动序列单天时段移动序列可定义如下‘一乳江,刀以尺之⋯汪刃以尺热,,则根据上面的定义有其中,是第天用户的时段移动序列,彻。一,,,,,,畜,一双了当畜的通话时段是。。,,,,,,二,,⋯卜对每个用户而言每天的通话记录可能会很少,凡,,缺少抽样点不利于描述个人行为轨迹采用多天累彻,,,,,,,⋯⋯计的通话记

7、录把用户多个单天时段移动序列进行,,,,,,,,,,⋯⋯累计得到的序列称为多天时段移动序列,,,本文问题可以描述为在给定移动数据集的基,一定义为艺它是进行分类的基姻础上,按照上述定义对数据进行序列转换,并根据用谭钧元等一种有效的基于生活嫡的移动用户分类算法,,户序列的特点规律性将移动用户进行高效分类为时间的时候这种时间序列的嫡就是所求生活嫡算法移动用户的生活嫡输入多天时段移动序列输出个人生活嫡数组。生活嫡的定义①,嫡是随机变量不确定度的度量借助嫡这个概②念来对移动用户生活规律性进行度量把移动用户③计算,的经验分布二,一天行为的时空信息以一个离散时间

8、序列来④,。建模这样人在某一个时间所在的位置就是序列。⑤乙,二,,‘中对应时间点的随机变量。通过统计的方法,一艺一艺任三⑥

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。