国内主题词表探究热点和趋势-基于词频统计和知识图谱方法.doc

国内主题词表探究热点和趋势-基于词频统计和知识图谱方法.doc

ID:51853924

大小:63.00 KB

页数:5页

时间:2020-03-17

国内主题词表探究热点和趋势-基于词频统计和知识图谱方法.doc_第1页
国内主题词表探究热点和趋势-基于词频统计和知识图谱方法.doc_第2页
国内主题词表探究热点和趋势-基于词频统计和知识图谱方法.doc_第3页
国内主题词表探究热点和趋势-基于词频统计和知识图谱方法.doc_第4页
国内主题词表探究热点和趋势-基于词频统计和知识图谱方法.doc_第5页
资源描述:

《国内主题词表探究热点和趋势-基于词频统计和知识图谱方法.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、国内主题词表探究热点和趋势:基于词频统计和知识图谱方法摘要:通过1980年〜2003年和2004年〜2011年两个时间段的词频统计与可视化知识图谱等方法的比较分析与研究,展现了国内主题词表研究领域的热点和趋势,认为:国内对主题词表的研究内容在时间上有明显的分界线、研究趋势展现了知识组织的演化过程、主题词表基于语义描述语言的本体转换是目前学界研究的热点和未来研究的趋势。关键词:主题词表;词频统计;知识图谱;研究热点;研究趋势Abstract:Basedonwordfrequencystatisticsandvisualizationofknowledgemappingandotherme

2、thodsofcomparativeanalysisandresearchintwoperiodsof1980一2003and2004一2011,thearticleshowstheareasofresearchfocusandtrendsofThesaurusinChina・Thatis:thereisacleardividinglineintwoperiods,andtrendsshowthattheevolutionprocessofknowledgeorganizationsystem,Thesaurusbasedonsemanticdescriptionlanguageont

3、ologyconversioniscurrentlyafocusofacademicresearchandfutureresearchtrends.Keywords:Thesaurus;WordFrequencyStatistics;KnowledgeMapping;ResearchFocus;ResearchTrends1引言主题词表(叙词表)是一种情报检索语言,它在早期情报检索和知识组织中发挥着非常重要的作用。早在1876年,美国图书馆学家卡特发表了他的《字典式目录条例》[l]o而随着计算机技术的发展,主题词表的功能也发生了相应的变化。另外,不断更新的网络技术,以及语义网等概念的技

4、术实现,也为主题词表的发展注入了活力。国内主题词表研究虽然起步较晚,但从《汉语主题词表》的问世,到《中国分类主题词表》的出版,均取得了卓越的成就。国内的研究主要集中在主题词表的介绍、评价、编制、修订、标引方法、应用及分类主题一体化等领域[2][3][4],另外,随着计算机网络技术的发展,各类词表被大量应用到了信息检索技术、知识组织与管理等领域之中[5][6]。那么,这些年来国内对主题词表的研究都触及了哪些主题?其研究的趋势和热点又在哪里?本文试图通过对发表在期刊上的学术论文进行研究,旨在为该领域同行了解和掌握研究方向提供些许帮助。2样本获取与研究方法2.1样本获取方法。本文获取数据样本

5、的方法是:在“中国学术期刊网络出版总库”中,用关键词“主题词表OR叙词表”,检索出1980年〜2011年间发表在"核心期刊”上的论文,因为《中文核心期刊要目总览》第一版在1992年才出版,上述检索结果仅命中了1992年〜2011年数据;因此,作者又补充了1980年〜1991年的相关主题数据。经过人工筛选,最后,获得样本数为480篇(检索日期:2012年2月12H)o2.2研究方法。本文主要应用文献计量学领域的词频统计方法和基于共词的可视化知识图谱方法。通过关键词词频的动态统计与分析,可以反映出某时间段内研究主题的动态变化过程,如高频关键词的发展期、高峰期及衰退期等。词共现(共词)分析方

6、法最早是在1986年由法国文献计量学家M.Callon等学者提出的[7]。在词共现分析方法的基础之上,我们可以运用社会网络分析方法及软件(如Pajek),绘制出各主题之间的相互联系的学科知识图谱。3研究结果3.1历年论文发表情况对480篇论文进行按年度统计,见图1。由图1可以发现,论文数量基本上呈上升趋势:1980年〜2003年为缓慢上升阶段,但1994年和1999年均有突出表现;2003年以后,呈现出了快速发展的态势。究其原因,一方面,随着计算机技术的发展,出现了诸如本体等语义网概念的应用研究,使得主题词表研究重新得到了重视;另一方面,有关主题词表的研究得到了更多的基金资助,2004

7、年以前,仅有8篇资助论文,而2004年及以后,资助论文达113篇,尤其是近两年,基金资助论文比例均达50%以上。2.2基于关键词词频统计。根据上述480篇论文的研究主题(关键词),我们可以通过关键词词频统计及共现计来分析国内主题词表研究的热点与趋势。由于有些论文发表年代尚早,作者没有给出关键词,因此笔者对这一部分关键词进行了人工补充;同时,为了集中主题,对一些一义多词的主要关键词进行了修正,如将“《中国图书馆图书分类法》”统一简称为“《中图法》

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。