欢迎来到天天文库
浏览记录
ID:23768008
大小:71.50 KB
页数:16页
时间:2018-11-10
《浅论社会网络大数据框架及其关键技术论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、浅论社会网络大数据框架及其关键技术论文社会X络大数据框架及其关键技术论文导读:本论文是一篇关于社会X络大数据框架及其关键技术的优秀论文范文,对正在写有关于社会论文的写有一定的参考和指导作用,X络火热发展的同时,社会X络中的数据量也呈现极快的增长的态势。截至2013年6月30日,Facebook用户数比上年同期增长21%;截至2013年9月,Tddh">SocialNetee(THSNAS)basedontheaboveframesofindividual,group,eventandholisticanalysis.The
2、analyticalframesofprecisionadvertising,personalizedinformationremendation,andsocialmanagement. Keyee)、类型(Variety)、速度(Velocity)和可用性(Veracity),具体特征如下: (1)超大规模的数据量 截止目前为止,Facebook、Twitter、新浪微博、腾讯微博的用户量已经分别超过12亿、5.5亿、5.4亿和5.8亿,此外,四大社会X络的每日消息量也已经分别超过了10亿、2.5亿、2亿和2亿。
3、这些超大规模的数据量为信息挖掘提供了丰富的资源。 (2)纷繁复杂的数据类型 社会X络中的每个用户都具有基本属性信息,这些属性包括用户名称、性别、所属位置、描述、创建时间、好友数量等;用户与用户的好友关系构成了关系数据;用户基于已经存在的关系或者共同兴趣构成了多种团体,产生了团体数据;用户每时每刻发表的观点、评论、转发等信息形成了非结构化的信息数据;用户上传的图片、音频、视频形成了多类别的非结构化数据等。社会X络中包含的数据类型繁多、结构不一。这些数据类型的多样性,为信息分析和挖掘带来了巨大的挑战[2]。 (3)极快的
4、增长速度 伴随着社会X络火热发展的同时,社会X络中的数据量也呈现极快的增长的态势。截至2013年6月30日,Facebook用户数比上年同期增长21%;截至2013年9月,Twitter用户数比2012年底增长了16.7%;截至2013年3月底,新浪微博用户数比2012年底增长了6.6%;截至2013年9月,腾讯微博用户数比上年年底增长了6.8%,此外,社会X络中的消息量也随之快速增长。 (4)可观的数据可用性 社会X络的出现触发了个人、企业、国家等不同层面的兴奋点[3],个人想通过社会X络分析了解自身或者他人的个人
5、爱好和行为习惯,企业想通过社会X络分析谋求更大的商业利益,国家想通过社会X络分析进行高效的社会管理。社会X络已经引起了国家战略、企业规划、商业模式、营销策略、生活观念、行为习惯等方面的变化[4]。 目前,已经出现了一股研究社会X络的热潮,之所以诸多国家、企业、专家、学者都在积极研究社会X络[5],是因为社会X络犹如金矿、石油、天然气一样,蕴含着巨大的信息宝藏。社会X络也认证了“数据为王”,谁能更快、更准、更全地掌握数据,谁能更有效地分析挖掘社会X络所隐含的信息价值,谁能预测信息的传播规律和发展态势,谁便能掌握主动权和战略
6、权。 本文5社会X络大数据框架及其关键技术论文导读:本论文是一篇关于社会X络大数据框架及其关键技术的优秀论文范文,对正在写有关于社会论文的写有一定的参考和指导作用,有大量的关键技术予以保障,下面将详述各层中的不同关键技术。 2.1数据层 数据层的设计理念是以数据为中心,以数据流向为导向,主要包括数据获取、数据打标和数据关联3个部分。 (1)数据获取 数据获取是社会X络大数据分析的基石,如何快速、有效获取社会X络的数据至关重要。针对这一理由,我们提出了2种社会X络数结合社会X络的数据类型、数据特征以及分析目的,提出
7、了一套社会X络大数据的分析框架,并对其关键和核心技术进行详细描述,该技术策略对广告精准投放、个性化信息推荐、社会管理等方面都具有一定的指导作用和实用价值。 1社会X络大数据分析框架 社会X络分析技术是一项关键技术,也是一项热门的研究[6-7],涵盖了社会学、人类学、社会语言学、地理、社会心理学、通信研究、资讯科学、社会X络分析与探勘、组织研究、经济学以及生物学等多个领域,是一项多学科交叉技术。社会X络又包涵巨大的用户数据、关系数据和信息数据,为了有效地对社会X络的大数据进行分析和挖掘,我们提出了一个层次化的分析框架,如
8、图1所示。 该分析框架包括数据层、分析层、支撑层和结果展示层四大部分。其中数据层是整个框架的基石,分析层和支撑层是整个框架的核心,结果展示层则是技术与应用的桥梁,能友好、简洁、形象地展示分析结果。(1)数据层 数据层包括数据获取、数据预处理和数据存储3个部分,其中数据获取主要通过X络流量方式、应用程
此文档下载收益归作者所有