欢迎来到天天文库
浏览记录
ID:24673263
大小:79.12 KB
页数:11页
时间:2018-11-15
《国内知识图谱研究的可视化分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、国内知识图谱研究的可视化分析[摘要]对国内知识图谱期刊论文的外部特征和内容特征进行可视化分析。研究表明:国内知识图谱研究处于起步阶段,研究人员和机构相对集中,研究论文的合著率较高,研究主题鲜明。今后的研究需要加强学科间的合作,加强基础理论研究,创新研究方法,优化数据质量。[关键词]知识图谱可视化共词分析Ucinet[分类号]G3101、引言知识图谱是以科学学为基础,涉及应用数学、信息科学及计算机科学诸学科交叉的领域,是科学计量学和信息计量学的新发展。随着统计分析、引文分析和网络分析方法在科学计量学
2、领域的广泛应用,以及计算机图形学和可视化技术的发展,知识图谱研究在20世纪90年代以后得到迅猛发展。知识图谱的研究发端于美国、荷兰等国。根据刘则渊教授对科学计量学重大变革的三条路径与重要人物的介绍,笔者认为国外知识图谱的研究主要有三大学派:①科学计量学学派。这个学派主要是以引文分析理论为基础研究不同学科的知识图谱。如加菲尔德等人(1%4年)手工绘制了DNA领域的历时态图谱;普赖斯(1965年)运用相同的数据完成了他的经典论文“科学论文网络”;Small(1973年)提出了论文“共被引”的概念和共被
3、引分析方法,并绘制了粒子物理学颂域高被引论文的共引图谱;White、MeCain、Noyons等人(1998年)将引文分析与多维尺度分析相结合,建立了基于多维尺度分析的知识图谱方法。②复杂网络学派。这个学派主要是利用复杂网络理论和方法对引文网络、科研合作网络、关键词共现网络等展开研究。如社会学家Hummon(1989年)把社会网络分析方法引入了引文网络研究,提出了引文网络中的关键路径算法;纽曼(2001年)用复杂网络方法测定了生物医药、物理学和计算机科学等领域科学合作网络中最有影响力的科学家,并揭
4、示了科学合作结构具有复杂网络的高集聚和小世界等特性。③可视化学派。这个学派的研究者将计算机科学的理论、方法和引文分析等有机结合,利用专门软件对大量反映知识结构及发展脉络的数据自动处理,生成可视化的知识图谱。如陈超美提出了探索关键路径的pathfinder算法,并开发了供全球用户免费下载使用的Citespace软件。他(2010年)还提出了多视角的共引分析方法,把共引网络分为多个聚类谱,重点关注聚类谱之间的相互关系。Mane和B6rner(2004年)探讨了Klein_berg跳变算法、共词分析和图
5、像展示技术在研究主题和发展趋势中发现中的应用。阿米德等学者(2004年)运用Wilmascope三维动画可视化技术对IEEEIn-foVis引文网络进行可视化分析。Henzingel和Law—rence(2004年}基于环球网图表模型和历时时间的聚焦式缓慢动态模型,进行科学研究共同体识别。总体看,国外学者在知识图谱的理论、方法和可视化软件等方面都处于领先地位。他们的研究内容涉及很多学科领域;科研合作也非常明显。在国内,以刘则渊教授为首的学术团队率先引入知识图谱的概念成立了网络一信息一科学一经济计量
6、实验室(WISELAB),并与鲁索、克雷奇默、陈超美等国外知名专家开展合作研究。本文利用可视化方法对国内知识图谱研究的研究现状进行分析,并提出这个领域今后需要加强的研究内容。2、数据来源与研究方法2.1数据来源本文从知网、万方和维普的期刊全文数据库获取了每篇研究知识图谱论文的题名、作者、机构、发文时间、发文期刊、关键词等相关数据;论文的研究方法、研究工具等数据通过人工采集方式完成。数据的时间范围是2005年1月到2010年8月。检索条件设定为题名或关键词中包含“知识图谱”的期刊论文,井检索到61篇
7、相关文献。知识图谱和知识地图在研究目的、研究方法和工具等方面有相似之处,但笔者认同文献的观点,两者之间存在差异。因此,本文没有将国内知识地图的研究成果纳入研究范围。2.2研究方法2.2.1文献计量方法本文中对表征论文外部特征的时间、发文期刊、作者、机构、研究主题等的数据进行统计、汇总,并通过Excel将数据转换为不同的图形。这样可以直观反映出国内知识图谱研究的成果数量及分布、研究队伍的基本状况、研究主题的分布、数据源分布等基本情况。2.2.2共词分析共词分析是由卡龙(Calion)和克泰尔(Cou
8、rtial)等引入情报学领域的一种内容分析和科学绘图法。这种方法不仅能够描绘学科领域的知识结构,还能够结合时间序列揭示学科结构的通过分演变历程。本文对论文中的关键词、作者、研究方法和研究工具等进行共词分析,通过共词网络来揭示研究对象之间的相互联系,进而去描绘在知识图谱研究中的主题结构、作者合作结构等现象。3、知识图谱研究成果外部特征的可视化分析3.1知识图谱研究成果的数量从图1看,国内知识图谱研究开始于2005年。近年来,研究论文的数量处于一个快速增长的阶段(2010年只有部分数据
此文档下载收益归作者所有