欢迎来到天天文库
浏览记录
ID:35465605
大小:68.15 KB
页数:8页
时间:2019-03-25
《试论本体的应用及其发展》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、试论本体应用及其发展【摘要】本文首先介绍了本体的概念,然后对本体的应用情况做了分析:本体应用研究主要集屮于本体在信息检索、信息抽取、异构信息系统的互操作和集成、语义Web四个领域的应用,并表现出以下特点:本体在信息检索、信息抽取、异构信息系统的互操作和集成3个领域的应用研究以方法论探索为中心,研究方法以算法、建模和系统架构为主。最后,本文对本体的发展趋势进行了总结。【关键字】本体;语义网;本体应用;本体发展趋势1本体的概念古希腊百科全书式的思想家亚里士多德(前384—前322年)首先把哲学规定为关于“本体”之学,西方哲学中近代德国哲学家沃尔夫(ChristianWolff,1679-1754)
2、第一次提出“本体”(Ontology),黑格尔(1770—1831)曾转述过它的定义:“本体,论述各种有关'存在'的、抽象的、完全普遍的哲学范畴,认为存在是唯一的、完善的;其中出现了唯一者、偶性、实体、因果诸范畴;这是抽象的形而上学。根据韦氏词典的解释,本体是形而上学的一个分支,研究关于自然和存在的关系。它试图冋答“什么是存在”,“存在的性质是什么”等等。在哲学界,本体作为表述哲学理论的术语,是指形成现象的根本实体。20世纪末,随着计算机技术的发展,本体被引入到信息学和人工智能领域。信息学和人工智能中所指的本体,从概念上划分,可以有两种理解:本体和狭义本体。本体的定义,它在计算机学界的定义和内
3、涵经历了一系列的发展过程:•1991年,Neches指出:“一个本体定义了组成主题领域的词汇的基本术语和关系,以及用于组合术语和关系以定义词汇的外延的规则。”该定义只是给出了建立一个本体的基本要素,即:要建立一个本体,首先要识别所处理领域的基本术语和这些术语之间的关系,而后识別组合这些术语和关系的规则,并提供这些术语和关系的定义。•1993年,Gruber指出:"本体是概念化(Conceptualization)的一个显式的规格说明。”;1997年,Borst对该定义进行了修改,提出:“本体是被共享的概念化的一个显式的规格说明。”。概念化(conceptualization)指某一概念系统所蕴
4、涵的语义结构,它是对某一事实结构的一组非正式的约束规则。它可以理解或表达为一组概念(如实体、属性、过程)及其定义和相互关系。概念化的清楚的详细说明是指:一个本体是対概念和关系的描述(就像程序的详细说明书),而这些概念和关系可能是针对一个代理或代理群体而存在的。这两个定义后來成为人们经常引用的定义,它们都特别强调了给出显式解释的可能性。•1999年,W订liam和Austin指出:"本体是用于描述或表达某一领域知识的一组概念或术语,可用于组织知识库较髙层次的知识抽象,也可用来描述特定领域的知识”。这种术语词汇表可以应用于特定领域或者主题。本体不仅仅是词汇表,而是整个上层知识库(包插用于描述这个知
5、识库的词汇)。它把本体看作知识的内主体,而不是描述知识的途径。•1999年,Chandrasekaran等人认为:“本体是属于人工智能领域中的内容理论,它研究特定领域知识的对象分类、对象属性和对象间的关系,为领域知识的描述提供术语。”O在以上不同研究者的定义中,Gruber的观点是学术界普遍认可、引用度最高的一种定义。其实从以上不同研究者的定义,也可以总结本体涉及到的概念为:术语(词汇)、术语关系、规则、概念化、形式化的规格说明、领域知识、表达和共亨。其实,本体就是指通过对于概念、术语及其相互关系的规范化描述,勾画出某一领域的基本知识体系和描述语言。一个概念化对象就是对世界的一些抽象且简明化的
6、观点。概念化对象可由部分表示领域,该领域屮相关事物状态的集合和领域空间上的概念关系。也就是说,本体是对客观世界全部或某一部分的概念化和结构化的明确表示和描述。2木体的应用随着互联网应用逐渐向智能化和口动化方向发展,本体作为概念模型和概念间关系的规范描述,被广泛应用于信息系统和下一代互联网语义网领域。本体在信息系统领域的应用,主要集中在信息检索、信息抽取、异构信息、系统的互操作和集成,为其提供语义层的操作支持;木体作为一种能在知识层提供知识共享、重用的工具,在语义网屮的应用研究也较为普遍。2.1本体在信息检索中的应用目前,国外对本体在信息检索领域的应用的研究较多,不少研究利用单个领域本体来改善特
7、定学科领域的信息检索效果。休斯顿大学提出一种基于用户询问的文本摘要技术来改善医学信息检索效果。他们选择美国国家医学图书馆开发的UMLS(一体化医学语言系统)作为其主要的医学本体知识库,UMLS能帮助医学信息系统理解生物医学和健康领域的概念和术语的内涵以及相互Z间的关系。首先,研究人员选取数个在线医学数据库作为医学资源信息来源,并通过网络爬虫从所选取的数据库中抽取文档并保存在本地文档库中,利用UML
此文档下载收益归作者所有