基于h指数及知识图谱学科探究热点研究

基于h指数及知识图谱学科探究热点研究

ID:43962827

大小:32.00 KB

页数:5页

时间:2019-10-17

基于h指数及知识图谱学科探究热点研究_第1页
基于h指数及知识图谱学科探究热点研究_第2页
基于h指数及知识图谱学科探究热点研究_第3页
基于h指数及知识图谱学科探究热点研究_第4页
基于h指数及知识图谱学科探究热点研究_第5页
资源描述:

《基于h指数及知识图谱学科探究热点研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于h指数及知识图谱学科探究热点研究〔摘要〕文章以h指数的定义,来界定高被引论文,然后以CiteSpaceII软件作为分析工具,以文献关键词作为节点。通过对关键词的频次和关键词之间的连接的分析,从而体现图情领域研究的热点和发展方向。〔关键词)h指数;知识图谱;CiteSpaceII;研究热点〔中图分类号)G250〔文献标识码)A〔文章编号〕1008-0821(2012)09-0163-05h指数代表“高引用次数(HighCitations),是在2005年由美国JorgeEHirsch教授首次提出,它将数量指标(发文量)和

2、质量指标(被引量)结合起来,更好地显示了科学工作者的科研成果。Hirsch将h指数定义为:一位作者的h指数等于其发表了h篇至少被引h次的论文,即一个作者的h指数表明其至多有h篇论文被引用了至少h次[1]O之后,Braun等将h指数用于评价期刊的质量,提出一种期刊的h指数等于该期刊发表了h篇每篇至少被引h次的论文,或者说一种期刊的h指数是该期刊所发表的全部论文中最多有h篇至少被引用了h次[2]。本文中,我们借鉴h指数的定义,认为某一学科领域某一年的h指数等于该领域在该年发表了h篇每篇至少被引h次的论文,或者说该学科领域该年所

3、发表的全部论文中至多有h篇被引用了h次。然后以h值作为界定高被引论文的阈值。知识图谱(MappingKnowledgeDomain),是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源极其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互关联[3]。CiteSpaceII是信息可视化领域的权威专家陈超美博士开发的可视化软件,属于多元、分时、动态的第二代信息可视化技术。它能够绘制科学知识图谱,显示一个学科或知识域在一定时期发展的趋势与动向,形成若干研究前沿领域的演进历程[4]。为了准确地分析本世

4、纪以来我国图情领域的研究热点,本文引用h指数的定义,来界定高被引论文,然后以CiteSpaceII软件作为分析工具,以文献关键词作为节点,通过对关键词的频次和关键词之间的连接的分析,从而体现图情领域研究的热点和发展方向。1数据收集及方法选择本文利用CNKI数据库中的中国学术期刊网络出版总库,选取''图书情报与数字图书馆”分类,分别检索发表于2000-2011年的核心期刊研究论文,按照被引频次降序排列,根据前文中对h指数的定义,统计出图情领域2000-2011年各年的论文的h指数,统计结果见表lo检索时间为2012年6月11

5、日。将统计出来的528篇文献记录输出保存,转换成CiteSpaceII可以识别的格式导入CiteSpaceII,然后对需要的参数进行设置,选择时间跨度为2000-2011年,时间切片为1年,主题来源为标题(Title)、摘要(Abstract)、主题词(Descriptors)、标识符(Identifiers),主题词类型为爆发词(BurstTerms),以关键词作为节点,选取每一时区被引频次最高的前30个关键词,以最小生成树的方式对记录进行分析,绘制出聚类的图谱。2结果分析2.1聚类图谱分析根据网络节点的组配,绘制出图情

6、领域高被引论文中文关键词的分析图谱,图谱由220个节点、225条连线组成。即分析文献中有220个关键词通过225条连线进行组配。如图1所示。图1图情领域高被引文献中文关键词聚类视图(1)根据关键词的词频统计,出现频次较高的有图书馆、数字图书馆、信息服务、高校图书馆、学科馆员、知识管理、图书馆服务、网络环境、云计算、大学图书馆、公共图书馆、服务模式、知识服务、创新等,这和聚类视图中显示出的各个节点相对应。每个节点代表一个关键词,节点的大小表示这个关键词出现的频次的高低,节点的年轮颜色和宽度代表关键词在时间维度上出现与发展的序

7、列和频次,节点之间的连线代表关键词在文章中出现的频次以及与其他关键词的联系。(2)在图1上面没有显示出来的,还有一些散落在四周的小节点,它们与图谱的中心没有直接的关联,如语义网、知识自由、h指数、期刊学科分类、期刊评价等,但反映出我国近12年来图情领域的新兴研究以及与其他领域相结合的尚不成熟的研究。2.2时间线分析对关键词聚类进行时间线分析,绘制出图情领域高被引文献中文关键词时间线图谱,如图2所示。在图2中可以看出,ModularityQ=0.5708,MeanSilhouette=0.7798。ModularityQ的取

8、值范围介于0〜1之间,越接近1,说明这个网络越具有模块性,可以很好的进行聚类,聚类内的联系越紧密,聚类间的联系越松散。MeanSilhouette的取值范围介于-1〜1之间,越接近于1,说明这个聚类的主题越明确。这个聚类结果的ModularityQ和MeanSilhouette值说明这次聚类是合适的[5

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。