基于citespaceⅲ对于大数据研究的可视化分析

基于citespaceⅲ对于大数据研究的可视化分析

ID:32636362

大小:67.26 KB

页数:10页

时间:2019-02-14

基于citespaceⅲ对于大数据研究的可视化分析_第1页
基于citespaceⅲ对于大数据研究的可视化分析_第2页
基于citespaceⅲ对于大数据研究的可视化分析_第3页
基于citespaceⅲ对于大数据研究的可视化分析_第4页
基于citespaceⅲ对于大数据研究的可视化分析_第5页
资源描述:

《基于citespaceⅲ对于大数据研究的可视化分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于citespaceIII对于大数据研究的可视化分析摘要:本文结合文献计量学的方法和citespace软件与excel软件,对2005-2015年间的webofscienceTM核心合集收录的2182篇大数据研究领域的文献分别进行了研究现状、知识基础、研究热点、研究前沿进行了可视化分析,进而揭示了国际大数据领域研究的特点规律及动态过程。关键词:大数据;大数据研究前沿;citespacelll中图分类号:G40-057文献识别码:A文章编号:1001-828X(2017)003-0-03引言随着智能手机、平板电脑等越来越多的智能移动终端被用户所

2、接受,而随着用户量的迅猛增长,数据也在以惊人的速度增长和累积。正是在全球数据暴涨的背景下大数据,一个用来形容这种庞大的数据集的名词应运而牛。目前,学术界、政界、工商界等都对其产牛了浓厚的兴趣。大数据是一个抽象的概念,不同领域的专家学者因对其关注的方向不同,所给出的定义也不相同。美国国家标准和技术研究院(NIST)从学术角度给大数据做了一个定义“大数据是指其数据量、采集速度或者数据表示限制了传统关系型方法进行有效分析的能力,或需要使用重要的水平缩放技术来实现高效处理的数据”。对于大数据的特征的描述,目前比较流行的是“3VS”和“4VS”两种。“3

3、VS”是由Gartner公司的分析师道格莱尼提出的,他将大数据描述为数量(volume)??大、种类(variety)繁多、速度(velocity)快且具有即时性的数据集。“4VS”则是由国际知名数据公司IDC提出的,在其发布的报告中是这样描述大数据的特征的“数量浩大、种类繁多、牛成快速、价值巨大单密度低”。正是由于学者专家高涨的研究热情,探索理清大数据的发展方向,明确大数据的研究前沿,理清大数据的知识基础对于大数据研究和管理则显得尤为重要。一、数据来源与研究方法本文所选取的数据库具体为科学引文索引SCIE(ScienceCitationInd

4、exexpand),检索式为"TS二bigdataANDTI二bigdata”,时间为2005—2015,检索结果有2,182条记录,来自webofscience核心合集。本文选用可视化分析软件为陈超美团队所开发的CiteSpace111来对所获取到的文献数据进行分析。将之前检索并下载的引文记录放入到data文件夹中,使用CiteSpaceIII创建一个新的project,时间跨度选择为2005-2015,选择每一年为一个时间段,termtypes选择burstterms,并分别选择author,institution,keyword,cite

5、dauthor,citedreference,citedjournal进行分析,设定阈值为:c(2,2,20),cc(3,3,20),ccv(3,3,20)o二、文献产量分析文献计量统计是科学研究中重要的研究方法,它能反映某一学科领域的文献随时间变化的一个分布状况以及研究主题的热度情况。表一为统计表,图一为每年散点图及趋势预测图。对于文献增长的规律用多项式函数进行拟合,得到拟合曲线y二-1.27x4+10223.44x3-30823881.64x2+41304216104.99x-20755444911937.60,R?二0.92,接近于1,且

6、曲线与数据点较为吻合,说明近期内文献数量将按照此曲线增长。根据图形我们可以把近十年来对大数据的研究分为两个阶段:1・萌芽期(2010年以前):2006年,大数据技术形成并运行运算与分布式系统,为大数据的深入研究奠定基础。2007隹1月吉姆格雷一一数据库软件先驱,第一次将这种转变称为第四范式,他认为面对这种范式,只能开发新一代的计算工具来处理海量数据。2008年,《Nature》在开辟了BigData专栏,同年计算机社区联盟(ComputingCommunityConsortium)发表了扌艮告BigDataComputing:CreatingR

7、evolutionaryBreakthroughsinCommerce,ScienceandSociety[1],阐述解决大数据问题的一些方法和技术。2010年2月,肯尼斯库克尔在《经济学人》上发表报告《数据,无所不在的数据》[2]o2•增长期(2011-2015):2011年2月为了对科学研究中大数据的问题及其重要性进行讨论,Science杂志出版专刊DealingwithDatao同年5月,继物联网,云计算之后,“大数据”成为又一个广受关注的名词,全球知名咨询公司麦肯锡(McKinsey&Company)肯锡全球研究院(MGI)将大数据再次

8、推向一个热潮,发布了一份报告一一《大数据:创新、竞争和牛产力的下一个新领域》[3]。同年,Gartner将大数据列入2012年十大战略新兴技术。6月,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。