欢迎来到天天文库
浏览记录
ID:28076750
大小:57.55 KB
页数:4页
时间:2018-12-07
《我国医学领域本体研究热点分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、我国医学领域本体研究热点分析一共词可视化视角利用CNKI(《中国学术期刊网络出版总库》、《中国优秀硕士学位论文全文数据库》、《中国博士学位论文全文数据库》、《中国重要会议论文全文数据库》)、CBM(中国生物医学文献数据库)、万方为数据情报源检索国A医学领域本体相关文献,检索时间为1990-2010/06o以共词分析法为主要研究方法,利用BICOMB软件、SAS9.1.3统计工具对这些文献的关键词进行分析,以探讨我国医学领域本体研究现状与热点领域,以期为本体在医学领域的进一步研究提供借鉴和参考。Ontology
2、源于希腊词汇,最平是竹学领域的一个概念,即本体是客观存在的一个系统的解释说明,是客观现实的抽象本质。自20世纪90年代以来,Ontology被计算机和人工智能领域引入,使其概念内涵发生了变化。此后对Ontology的定义有很多种,其中被人们普遍接受的是1993年由Gruber出的定义:“Ontology是对概念体系明确的、形式化的、可共享的规范说明。”[l]StUder等对己有的定义进行了深入的研宂,认为“本体是共享概念模型的明确的形式化规范说明”,它包含4层含义:①概念模型:通过抽象出客观世界屮一些现象的相
3、关概念而得到的模型;②明确:概念及它们之间联系都被明确定义和界定;③形式化:本体是计算机可读或可被计算机处理的;④共享:本体中反映的知识是相关领域中公认的概念集。Ontology作为一种能够在语义和知识层次上描述信息系统和具有良好的逻辑推理能力的概念模型建模工具,A被提出以来就引起了国外及国内众多研宂人员的关注,并在计算机领域、医药卫生领域、农业领域、军事领域、电信领域等众多领域得到了广泛的应用。目前本体在医学领域的理论研究H趋成熟,理论体系正在逐步完善;应用研究还处于不断发展阶段P]。作为一个新兴的研究领域
4、,其研究方向呈现多元化,因此有必要分析当前国内医学领域本体的研宂热点及其主要研宂内容。现采用共词分析法等定量分析方法客观地分析当前国内医学领域本体的研宄热点,,以期为本体在医学领域的进一步研宄提供借鉴和参考。1材料和方法1.1数据来源以国内规模最大、收录最全、使用最广泛的CNKI的《中国学术期刊网络出版总库》、《中国优秀硕士学位论文全文数据库》、《中国博士学位论文全文数据库》、《中国重要会议论文全文数据库》,中国生物医学文献数据库(CBM)、万方生物医学期刊全文数据库作为数据情报源,检索时间选择为1990/2
5、010-06。首先为保证查企率,选取的文献数据为以下3个检索结果的并集:①在医学领域闪检索本体相关论文,检索式为FT=医学ormedicalandSU=本体orontology;②把国I々外各个重要的医学领域本体作为n主题n进行检索以尽fi减小漏检的可能,检索式为:SU=UMLSorSU=GeneOntologyorSU=SNOMEDorSU=OBOFoundryorSU=GALENorSU=TCMLS;③在其他数据情报源CBM、万方巾检索相关文献。其次为保证杏准率人工剔除以上并集中重复文献、不相关的文献,主
6、要是排除哲学领域本体、医学本体感觉等不相关的文献;最后经过统计,共检出医学领域本体研宄相关期刊论文、硕博士论文、会议论文共373篇。1.2研究方法和工具1.2.1研究方法概述共词分析法(co-wordanalysis)属于闪界分析方法,是早在20世纪70年代中后期由法国文献计量学家提出的一个概念[3]。它的基本原理主要是对一组词两两统计它们在同一篇文献屮出现的次数,以此为基础对这些词进行聚类分析,从而反映出这些词之间的亲疏关系,进而分析这些词所代表的学科和主题的结构变化。它利用大量文献中共同出现的关键词对有效
7、地反映文本关键词之间的关联强度,减少了关键词的空间,用一套结构图有效地展示了关键词之间的关联14』。共词分析法所研究的是某一学科领域当前学术文献所集屮关注的主题,不仅适用于成熟学科,亦可用于探讨新兴学科的研究热点、知识结构及其发展趋势[5]。共词分析法的步骤一般首先是从相关文献屮提取关键词或主题词,按照它们山现的频次从高到低排序,抽取的高频关键词或主题词;其次,两两统计抽取的高频词在同一篇文献中共同出现的次数,形成共词矩阵:最后依据共词矩阵进行多元统计分析,主要有因子分析、聚类分析和多维尺度分析L6J。聚类分
8、析(clusteranalysis)是将一批样本数据(或变MO归类到不同的类或者簇的一个过程,所以同一个簇屮的对象有很大的相似性,而不同簇间的对象有很大的相异性。基本的思想是认为所研究的变量之间存在着程度不同的相似性(亲疏关系)。根据一批研究对象的多个变量指标,具体找出一些能够测度这些变量指标之间相似程度的统计量,以这些统计量为划分依据,把一些相似程度较大的变量聚合为一类,把另外一些彼此之间相似程度
此文档下载收益归作者所有