欢迎来到天天文库
浏览记录
ID:44065036
大小:59.93 KB
页数:12页
时间:2019-10-18
《国内图书馆大数据研究的知识图谱分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、国内图书馆大数据研究的知识图谱分析摘要:文章以20127D2016年CNKI数据库中收录的主题为大数据的相关文献为研究对象,借助信息可视化软件CiteSpace和VOSviewer软件绘制出科学知识图谱,通过对作者及其机??合著网络视图的解读,分析了该领域的代表作者、研究力量分布的相互关系,又通过对知识图谱的研读,探析了该领域的研究热点及研究主题。中图分类号:G250文献标识码:A文章编号:1003-1588(2017)05-0124-03关键词:大数据;知识图谱;可视化分析;CiteSpace;VOSviewer“大数据”不仅是海量的、类型多样的结构化数据(如图片、声音、视频、地理位置信息
2、等)、非结构化数据、半结构化数据的集合,它更是一种技术和理念,宗旨就是从海量、多样性的数据资源中,进行深层次的挖掘,快速获得有价值的信息,以创造巨大的经济、社会及科研价值[1]o1数据来源和研究方法近年来,大数据的研究与应用已经引起IT界、政府及科研部门等相关行业的广泛关注,国内图书馆界也掀起了大数据的研究热潮,涌现出一大批相关研究成果和文献。笔者以中国知网(CNKI)为数据源,以主题为检索项,以大数据检索专辑名称为图书2,069篇(检索日期2016年9月10H),通过手工筛选,剔除89篇非学术性论文及关联性不大的文章,共搜集到从20127D2016年刊发(BigData)为检索词,不限刊发
3、时间,情报与数字图书馆,共检索出原始文献的有效文献1,980篇。因此,笔者选取了20127D2016年这5年间的文献数据做大数据领域的知识图谱进行分析。由于VOSviewer在聚类技术、图谱绘制等方面有独特优势,因此,笔者综合运用了CiteSpace和VOSviewer来绘制相应的科学知识图谱,综合运用二者的优势,对近几年国内图书馆大数据研究领域的作者、机构、热点主题及前沿领域进行探究,准确地挖掘该研究主题的本质。2数据分析2.1文献发表时间分布20077D2016年,国内图书馆大数据研究文献总发文量为1,986篇,其中20077D2011年的发文量较少,仅有6篇。2007年,随着云计算、物
4、联网、机构仓储、语义网络等相关领域的快速发展,大规模数据的挖掘、整合、存储成为学术界研究的热点,为后来大数据主题的相关研究孕育了基础。笔者通过分析文献发现,国内图书馆关于大数据的确切概念研究的第一篇文献发表于2012年,同时,2012年随着大数据的技术优势及价值被广泛认知,大数据迅速成为各学科领域研究的重点和热点。此后,国内图书馆对大数据的研究日益活跃起来,自2013年以后,大数据进入快速发展阶段,相关研究文献量呈现急剧增长的态势,这充分表明了大数据已经成为国内图书馆研究的又一热点。2.2文献代表作者及其机构综合分析2.2.1综合考虑发文量和突现值的代表作者。在CiteSpace界面中,时间
5、设置为20127D2016年,分段时间为1年,节点类型为作者,采用CiteSpace提供的突现词检测(BurstDetection)算法,得到发表论文数上6篇以及突现值排名前10的作者(见表仁图1),并初步确定这些作者为图书馆大数据研究领域的核心作者。从图1可以看出,组成的3人以上的小团体比较多,但子网间的联系较少,彼此之间的合作关系不是很紧密。在3人以上的团体中,最大的是以桂林理工大学图书馆的张兴旺为中心的研究团体,核心成员包括李晨晖、黄晓斌等;发文量最多的是由马晓亭、陈臣等组成的团体,该团体共发表文献41篇。2.2.2研究机构知识图谱分析。国内图书馆大数据研究领域发文量上8篇的机构共有1
6、2个(见表2),这12个机构共发表文献229篇,占发文总量的11.53%o其中发文量最多的机构是武汉大学信息管理学院,其次是南京大学信息管理学院,这两个机构是目前国内公认的图情教育规模最大、实力最强的高校院系。网络节点类型选择“机构”,运行CiteSpace得到该主题研究的机构聚类知识图谱(见图2)。由图2可知,各个机构间的合作不是很紧密,存在的合作关系中大多局限于区域内的机构合作,且合作频次较低,表明该主题领域研究机构众多,但研究实力不强,还处于相对封闭且分散的状态。2.3研究热点聚类结果分析通过绘制关键词共现知识图谱,根据关键词出现频次的高低可以确定一个领域的研究热点[2]o首先,将出现
7、频次10次以上(含10次)的78个有效关键词构建成“78*78”的共词矩阵;其次,利用Ucinet及其内嵌的Netdraw工具处理过程性数据[3];最后,把生成的NET文件导入VOSviewer进行共词聚类分析,生成如图3所示的关键词聚类标签图谱。从图3可以看出,每一种颜色代表了一个类别,拥有相同颜色的节点属于同一个聚类。此外,笔者通过去除一些边缘类别,整理出国内图书馆大数据研究领域7大类关键词类簇(见表3)
此文档下载收益归作者所有