1995~2013年大数据研究论文计量分析-论文.pdf

1995~2013年大数据研究论文计量分析-论文.pdf

ID:58065905

大小:213.61 KB

页数:2页

时间:2020-04-21

1995~2013年大数据研究论文计量分析-论文.pdf_第1页
1995~2013年大数据研究论文计量分析-论文.pdf_第2页
资源描述:

《1995~2013年大数据研究论文计量分析-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、1995~2013年大数据研究论文计量分析崔伟华大连理工大学李冰张欢【摘要】本文运用文献计量方法,~CNKI中收录的1995~2013年国内在大数据领域的论文为数据源基础,从数据来源、文献增长规律、作者分布规律、期刊以及关键词角度进行统计和分析,归纳出我国在大数据领域的研究重点和热点。【关键词】大数据;布拉德福定律;洛特卡定律;普赖斯定律;因子分析1.引言其次为信息经济与邮政经济学科。大数据4.2高产作者分析伴随着网络行为的日益普及和发展,是互联网迅猛发展的一个附加概念,需要科学论文的发表是目前评价科技人员无论是机构还

2、是个人每天都会面对和制造不断地理论探索与技术实现,大数据的技创造性劳动的重要指标,科技人员也将发大量的数据。“大数据”就是指是由人类日术探索与应用实践均为近年来的研究热点。表科学论文作为他们自我表现和确认自己益普及的网络行为所伴生的,受到相关部不同学科领域的专家学者均对大数据的具在科学社会中地位的一种手段。根据普赖门、企业采集的,蕴含数据生产者真实意图、体应用进行探索,表现最为突出的是企业斯的研究,在文献分布领域内,有86.46%喜好的,非传统结构和意义的数据。本文经济、新闻与传媒、自然地理和测绘学等的科学家一生只发表

3、一篇论文,根据对作将在CNKI数据库的文献资源基础上,对国学科。者人数的分析得出在大数据研究领域撰写内在大数据领域的研究现状进行分析,为4.作者分布规律分析一篇论文的作者占82.23%,与普赖斯的统今后的进一步研究提供参考。4.1洛特卡分布规律计结果基本一致。本文在中国期刊全文数据库(CNKI)洛特卡定律的经典公式为Y(x)=C/x,洛特卡在分析作者的生产能力时,排以“大数据”为检索主题词,筛选出1995—其中,y(x)为发表X篇论文的作者数占作除了高产作者,而普赖斯却注意到了高产2013年19年间期刊、特色期刊、博-

4、l:论者总数的比例。该公式用来表示,撰写了作者对学科的推动作用,由此提出了著名文、硕士论文以及学术辑刊上发表的所有X篇论文的作者数占作者总数的比例Y(x)的普赖斯平方根定律,即在某一特定领域文献,共下献8158篇,剔除没有作者的文与其所撰写的论文数X的平方成反比。在中,全部论文的半数系有该领域中全部作献共7304篇。主要借助Excel、SATI进计算过程中排除了高产作者,因此本文只者平方根的那些人撰写的。其数学表达式行数据整理,利用Matlab进行数据拟合,统计发文量小于等于8篇的作者数,而大可表示为:∑。()=√Ⅳ,

5、其中,n(x)为撰以及使用SPSS进行统计分析,阐述国内于8篇的作者数在所有作者中的比例不到写X篇论文的作者数,i=n⋯,为该学科规1995~20l3年大数据领域的研究论文发0.1%,对结果不会造成影响。定时期内最高产作者的论文数,N为全部表规律。根据洛特卡定律的一般表达式,即:作者总数。2.文献增长规律分析Y(X)=C/xC>O,x=l,2,3⋯x,其中X表根据这一定律可知,在大数据领域现随着云时代的来I临,大数据(Bigdata)示在一定时期内作者撰文的最大能力,用有的10207位作者中,前101位(即-]1020

6、7也吸引了越来越多的关注。国外对大数据来计算我国数字图书馆领域作者的洛特卡101)作者应为高产作者,他们的发文量都这一崭新领域的研究比较领先,而国内则公式。本次研究中,共统计出相关作者在3篇以上。紧追其后,不断发展。国内1995年至201310207位,共发表论文7304篇。针对本文4.3核心作者发文量分析年间在大数据研究领域发表论文数量不断研究需要表3中只列出了发文量小于等于按普赖斯的理论,发表论文数为1增加,本文利用matlab拟合工具箱绘制了8篇的作者数据。利用最小二乘法对n值篇以上的作者为杰出科学家即核心作文献

7、数量指数增长曲线即普赖斯曲线,以进行计算,即:者,其m=O.8646n⋯。。即核心作者中便更为清晰直观地看出文献增长规律,结Ⅳ∑XY—EX∑y发文量最低的作者发文篇数计算公式果如图1所示。NEX一(∑)为m=O.8646r~,式中n为发文量其中X=lgx,Y=lg(Y),其中X为1个最多作者的发文篇数。这里我们算出人发表论文的数量,y为对应的作者人数,m=0.749(2O)1/2=3.387篇。即在大数据领N为全部作者数,共10207位。域核心作者群体的发文量篇均都在4篇以衰1发文量小于8篇的作者分布数据上。论文数5.

8、期刊分析x(篇/作者论文XYX}YX}X人)数y总数5.1期刊分布状态18825882503.94571500文献在期刊上的分布呈离散状态,英29621924O.301032.9831750.8980250.090619国布拉德福德通过研究发现文献在期刊上32347020.4771212.3692161.1304030.22764

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。