国内大数据研究文献计量分析.pdf

国内大数据研究文献计量分析.pdf

ID:55317627

大小:214.82 KB

页数:3页

时间:2020-05-14

国内大数据研究文献计量分析.pdf_第1页
国内大数据研究文献计量分析.pdf_第2页
国内大数据研究文献计量分析.pdf_第3页
资源描述:

《国内大数据研究文献计量分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2015年3月情报探索第3期(总209期)MAR.2015InformationResearchNo.3(SerialNo.209)国内大数据研究文献计量分析张世怡(天津师范大学图书馆天津300387)摘要:以CNKI期刊数据库收录的2005-2014年大数据研究论文为研究对象,使用文献计量学方法,借助SPSS软件,对论文增长趋势、高产作者、核心作者发文量、合著者、载文期刊和关键词等进行分析,并验证了洛特卡分布规律,为今后国内学者开展大数据研究提供参考。关键词:大数据;文献计量学;拟合模型;洛特卡定律;SPsS中图分类号:G250.252文献标识码:

2、Adoi:10.3969~.issn.1005—8095.2015.03.006BibliometricAnalysisofResearchesonBigDatainChinaZhangShiyi(TianjinNormalUniversityLibrary,Tianjin300387)Abstract:ThepapertakesCNKIperiodicaldatabase-includeddocumentsonbigdatafrom2005to2014asresearchobject,usesbibliometricmethodsandsoftwa

3、reSPSStoanalyzedocumentsgrowthtrend,productiveauthors,amountofcoreauthors’documents,CO—authors,periodicalsandkeywords,andverifyLotka’Slaw,SOastoprovidereferenceforChinesescholar’Sfutureresearchonbigdata.Keywords:bigdata;bibliometrics;fittingmodel;Lotka’Slaw;SPSS1数据来源和处理方法有关大数据研

4、究的论文开始小幅增长,截至20121.1数据来源年,有关论文呈现出显著的增长态势(由于收集数据本文选取CNKI中国期刊全文数据库作为数据的截止时间为2014年初,所以2014年的发文量数来源,将“SU=大数据”作为检索项,时间跨度选取据不全),具体数据如表1所示。2005-2014年(共10年),期刊范围选取“全部期从表1可以看出.从2005年到2011年。我国有刊”,从而提高文献的检全率,最终通过数据筛选、剔关于大数据研究一直处表12005—2014年除,得到论文共计5783篇。于增长态势,但其每年的论文分布(篇)1.2处理方法递增量却相对稳定.没

5、有主要采用SPSS(社会科学统计软件包)作为数出现显著的跳跃式增长,据分析处理工具。SPSS是世界上最早的统计分析软直到2012年,才出现较件,也是最早采用图形菜单驱动界面的统计软件,它大幅度的增长,相对2011的基本功能包括数据管理、统计分析、图表分析和输年,2012年有关大数据的出管理等。本文采用定量分析方法,通过SPSS自带论文就已经增长至841的拟合模型功能。模拟出10年中,我国国内有关大篇,是2011年的2倍多。数据研究论文的增长趋势拟合图。并通过该软件中这说明有关大数据的研的其他统计功能,为本文的定量分析提供技术保障。究开始在我国研究领域

6、2文献计量分析得到重视并在多领域得2.1增长趋势拟合到拓展。我国有关大数据的研究相对较晚,且多是在国为了了解国内大数据论文的增长情况。本文结外相关理论的基础上进行的。对CNKI全文数据库合信息计量学的相关理论,以文献累积量为依据,进行相关文献检索可以发现,从2005年开始,我国对大数据研究文献的增长规律进行了时间序列的统收稿日期:2014—10—09十本文系天津师范大学青年基金项目“大数据环境下大学生数据素养培养模式研究——以天津师范大学图书馆为例”(项目编号:52WU1309)成果之一。作者简介:张世怡(1986一),女,硕士,助理馆员,主要研究方

7、向为图书馆学、情报学,发表论文多篇。2015年3月情报探索第3期(总209期)计研究分析。论文的洛特卡公式为yx=O.65/x撕。在此,我们验证了时间序列的曲线估计是分析因变量与时间关系大数据研究领域作者分布的洛特卡定律。的一种曲线估计_1]。其中以年度为自变量,以论文累2.2.2高产作者分布积量为因变量,作者通过SPSS中的多种常用模型进高产作者和核心作者是某一研究领域的主要推行曲线拟合,进而得到各种拟合方式相关数据如表动者。因此对高产作者、核心作者的分析是了解某一2所示领域研究发展方向的重要内容之一。本文应用洛特卡定律、普赖斯定律,对2005—2

8、014年大数据研究领表2各种曲线拟合的相关数据域的学者及其研究论文进行分析,找到了存在于该领域中的高产作者和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。