在线用户行为演化研究.pdf

在线用户行为演化研究.pdf

ID:32607986

大小:2.36 MB

页数:132页

时间:2019-02-13

在线用户行为演化研究.pdf_第1页
在线用户行为演化研究.pdf_第2页
在线用户行为演化研究.pdf_第3页
在线用户行为演化研究.pdf_第4页
在线用户行为演化研究.pdf_第5页
资源描述:

《在线用户行为演化研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、博士学位论文DOCTORALDISSERTATION论文题目:在线用户行为演化研究(英文):Evolutionarydynamicsofonlineuserbehaviors作者:李勇指导教师:孟小峰教授2016年5月11日中国人民大学博士学位论文(中文题目)在线用户行为演化研究(外文题目)Evolutionarydynamicsofonlineuserbehaviors作者学号:2012000704作者姓名:李勇所在学院:信息学院专业名称:计算机软件与理论研究方向:Web大数据分析导师姓名:孟小峰教授论文主题词

2、:在线用户行为;网络科学;社会计(3-5个)算;集体注意力;异速标度律论文提交日期:2016年5月11日论文摘要信息技术的飞速发展,特别是物联网、云计算、社交网络、社会媒体以及信息获取技术的进步,数据正以前所未有的速度迅速增长和积累,大数据时代已经到来。网络大数据中与在线用户行为相关的数据,例如在线点击数据、通讯记录、电子商务交易记录等,为深度挖掘人类行为带来了机遇,也为定量研究用户在Web上长期的、复杂的交互模式提供了便利。本文基于中国互联网络信息中心(CNNIC)的志愿者用户在线行为数据,在社会计算跨学科研究

3、范式应用的基础上,研究了人类兴趣以及在线集体用户注意力流的演化规律,主要研究内容包括以下几方面:1、跨学科研究范式社会计算的探讨社会计算作为一种数据密集型科学,在收集和分析数据的广度、深度以及规模上都产生了巨大影响,作为一种新的计算范式,产生了新的跨学科研究与应用领域,其广阔的研究内容与应用已引起了学术界和工业界的广泛关注。本文分析了社会计算产生的历史背景及概念、研究现状及大数据带来的机遇,综述了社会计算不同的研究领域,主要包括两方面:一方面针对社会科学,包括计算社会科学、计算社会学、社会网络分析等;另一方面针对

4、技术应用,包括社交应用、娱乐应用、生产应用等,这两方面的发展趋势同时又相互影响。进一步讨论了社会计算研究领域存在的挑战,包括跨学科合作与训练的问题、科学研究中大数据共享问题以及隐私保护问题等。2、在线用户兴趣长程演化研究Web用户行为建模时常见的一个前提假设就是人的行为符合马尔可夫过程,用户的下一行为仅依赖于当前行为,与过去的历史行为无关。然而,在线用户行为是一个复杂过程,常常依赖于人的兴趣,迄今为至人们对于人类兴趣动力学的本质规律还知之甚少。本文基于块熵理论对在线用户行为进行分类研究,通过信息论分析方法,结合熵

5、增曲线的离散导数和离散积分理论,分析在线用户点击行为的随机性和记忆性特征。研究表明,与常见的假设不同,Web用户的行为并不是一个简单的马尔可夫过程,而是一个符合幂率的非周期无限长程记忆过程。进一步还发现,用户在线连续点击7个兴趣点,其行为的平均预测I增益就可达到95.3%以上,可为大数据时代的在线用户兴趣精准预测提供数据长度的理论下界。3、在线集体用户注意力流:Web演化的“能量”引擎如果把Web看作是一个虚拟生命组织,根据新陈代谢理论,Web必须吸收“能量”来生长、繁衍和发展,本文感兴趣的问题是:(1)Web发

6、展所需“能量”来自何方?(2)基于这种“能量”,一个站点能否在整个Web上产生宏观影响力?本文基于在线用户行为数据,将站点的影响力看作新陈代谢,将在线用户的集体注意力流看作Web站点发展演化所需的“能量”,基于网络科学理论建立注意力流网络,研究了集体注意力在不同站点间的分布与流动以及Web的新陈代谢规律。研究发现,一个站点的影响力与注意力在该站点上的停留时间呈亚线性关系,亦即Web版的Kleiber律,这与人们的常识“用户的停留时间越多,则站点的影响力就越大”不相符。进一步发现,站点的影响力与流经该站点的注意力流

7、的强度呈超线性关系。研究还发现,Web站点的发展可分为三个阶段:不确定生长相、部分加速生长相和全加速生长相。将提出的注意力流模型与广泛应用的超链接模型作了对比分析,发现注意力流网络是一个有效的站点评估和排名工具。4、在线集体注意力流的普适模式研究如果将当前世界上最大的人造软件系统——万维网看作一个生命组织,根据新陈代谢理论,Web必须吸收能量来生长和演化,我们想知道:(1)这种“能量”来自那里?(2)这种“能量”的普适模式是什么?我们猜测Web站点的存活和发展高度依赖于一种“能量”,即在线集体用户的注意力流。知道

8、集体用户的注意力流在不同Web站点间的分布及其普适模式,对于理解Web与用户在线行为之间协同演化的机制至关重要。本文基于在线集体用户冲浪数据构建加权注意力流网络,并定义了多个与Web站点权重相关的基本变量,包括注意力流的强度、集体用户在一个站点上的停留总时间、注意力流的耗散量等,基于这些基本变量推断注意力流的普适模式。研究发现:(1)基本变量的异质性可以用有序离散通用Be

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。