语义web与知识管理

语义web与知识管理

ID:18555897

大小:276.95 KB

页数:17页

时间:2018-09-19

上传者:xinshengwencai
语义web与知识管理_第1页
语义web与知识管理_第2页
语义web与知识管理_第3页
语义web与知识管理_第4页
语义web与知识管理_第5页
资源描述:

《语义web与知识管理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

语义web与知识管理语义web与知识管理计81班李存禄高春阳安多分工明细:整理ppt及project展示:李存禄撰写总结论文:高春阳搜集材料:安多17 语义web与知识管理摘要:关键词:语义web、xml、RDF、Ontology、ALC、web服务、知识管理、SHOE、OML、XOL、OWL、智能Agent服务17 语义web与知识管理一、语义Web概况:历史:1998年Web的发明者国际W3C主席TimBerners-Lee首次提出了语义Web的概念。2001年9月9日国际W3C“技术与社会领域(TechnologyandSocietyDomain)”下的语义Web活动论坛(SemanticWebActivity)正式宣告成立。语义Web活动论坛在其宣言中指出:“语义Web是当前Web的一个扩展,其中信息具有形式化定义的语义,更有助于计算机之间以及计算机与人之间的协同工作。其思想是使Web上的数据以这样一种方式来定义与链接,使其能够在各种不同的应用场景中有效地实现数据的发现、自动化处理、集成与复用。当且仅当Web不仅成为人所共享加工的场所,也成为自动化工具所共享加工的场所时,语义Web方能实现其全部潜力。”定义:简单的说,语义就是资源的含义(资源是一个很广泛的概念,它可以是网站、网页,甚至是网页中的部分内容);语义Web是具有明确语义的能够被机器和人理解的网络。也就是说,语义Web是一种能够理解人类语言的智能网络,它使得人-机间及机-机间的交流变得像人-人间的交流一样便利流畅。语义Web是一个网,它包含了文档和文档的一些部分,描述了事物间的明显关系,且包含语义信息,以便于机器的自动处理。用途:万维网之父蒂姆·贝纳斯-李(TimBerners-Lee)称,使用“语义Web”的用户将可应用远远强于现有网络中任何东西的功能。他表示,在“语义Web”中,用户可将两个毫不相干的东西连接在一起,比如说银行报帐单和日历。用户可以将银行报帐单拖到日历上,也可以将日历拖到银行报帐单上,这样就可以知道何时应当进行支付。他指出,“语义Web”将呈现给人们的是一个所有数据“无缝”式连接的网络。在“语义Web”(semanticWeb)技术破土而出之后,目前人们对Facebook和MySpace等社交网站的“痴迷”终将被“无所不连”的网络所取代。17 语义web与知识管理二、语义Web结构:语义web结构图如上图所示,语义web共分七层结构,下面逐层介绍:第一层:Unicode和URIUnicode是一个字符集,这个字符集中所有字符都用两个字节表示,可以表示65536个字符,基本上包括了世界上所有语言的字符。数据格式采用Unicode的好处就是它支持世界上所有主要语言的混合,并且可以同时进行检索。URI(UniformResourceIdentifier),即统一资源定位符,用于唯一标识网络上的一个概念或资源。在语义Web体系结构中,该层是整个语义Web的基础,其中Unicode负责处理资源的编码,URI负责资源的标识。第二层:XML+NS+xmlschemaXML是一个精简的SGML,它综合了SGML的丰富功能与HTML的易用性,它允许用户在文档中加入任意的结构,而无需说明这些结构的含意。NS(NameSpace)即命名空间,由URI索引确定,目的是为了避免不同的应用使用同样的字符描述不同的事物。XMLSchema是DTD(DocumentDataType)的替代品,它本身采用XML语法,但比DTD更加灵活,提供更多的数据类型,能更好地为有效的XML文档服务并提供数据校验机制。正是由于XML灵活的结构性、由URI索引的NS17 语义web与知识管理而带来的数据可确定性以及XMLSchema所提供的多种数据类型及检验机制,使其成为语义Web体系结构的重要组成部分。该层负责从语法上表示数据的内容和结构,通过使用标准的语言将网络信息的表现形式、数据结构和内容分离。第三层:RDF+rdfschema。RDF是一种描述WWW上的信息资源的一种语言,其目标是建立一种供多种元数据标准共存的框架。该框架能充分利用各种元数据的优势,进行基于Web的数据交换和再利用。RDF解决的是如何采用XML标准语法无二义性地描述资源对象的问题,使得所描述的资源的元数据信息成为机器可理解的信息。如果把XML看作为一种标准化的元数据语法规范的话,那么RDF就可以看作为一种标准化的元数据语义描述规范。Rdfschema使用一种机器可以理解的体系来定义描述资源的词汇,其目的是提供词汇嵌入的机制或框架,在该框架下多种词汇可以集成在一起实现对Web资源的描述。第四层:Ontologyvocabulary。该层是在RDF(S)基础上定义的概念及其关系的抽象描述,用于描述应用领域的知识,描述各类资源及资源之间的关系,实现对词汇表的扩展。在这一层,用户不仅可以定义概念而且可以定义概念之间丰富的关系。第五至七层:Logic、Proof、Trust。Logic负责提供公理和推理规则,而Logic一旦建立,便可以通过逻辑推理对资源、资源之间的关系以及推理结果进行验证,证明其有效性。通过Proof交换以及数字签名,建立一定的信任关系,从而证明语义Web输出的可靠性以及其是否符合用户的要求。简单的说,各层的意义如下:第1层Unicode和URI是整个语义Web的基础。Unicode是一种字符编码标准,它支持世界上的所有语言;URI是web的核心概念之一,它能够唯一地标识web上的任意一个资源。第2层XML+NS+XMLSchema是语法层,用于表示数据的内容和结构。17 语义web与知识管理XML提供了文档结构化的语法,实现了文档结构与文档表现形式的分离。XMLSchema是约束XML文档结构的语言。XML名字空间是名字的一个集合,用于文档元素和属性名有效性的验证,由URI引用来标识。第3层RDF+RDFSchema是数据层,用于描述Web上的资源及其类型。RDF是结构化的元数据编码、交换和重用的一个基础。RDF数据模型提供了简单的语义,RDF属性可以看作是资源的属性,同时又表达了资源之间的关系。RDFSchema为RDF模型提供了一个基本的类型系统。第4层OntologyVocabulary是本体层,用于描述各种资源之间的联系。本体层提供一个能明确地形式化地定义术语含义及术语间关系的语言,以准确定义术语语义及术语间的关系。第5层~第7层是Logic,Proof和Trust,是在下面4层的基础上进行的逻辑推理操作,包括公理和推理规则、认证机制及信任机制。最后,贯穿全过程的是数字签名和加密。这是实现Web信任机制的关键技术,为机器提供验证某信息是否可信任的证据。语义web的最大优点是可让计算机具有对网络空间所存储的数据,进行评估的能力。这样,计算机就可以像人脑一样“理解”信息的含义,完成“智能代理”的功能。使用语义web搜索引擎搜索的结果比web更为准确。语义web提供了一种崭新的信息描述和知识表达的手段,而在语义层次上实现信息的互操作,就需要对信息含义的理解达成一致。语义web采用了本体(Ontology)的思想,本体描述的是具有共识的、概念化得事物,它对实现语义层次上的知识共享、知识重用等发挥着核心作用。三、语义web的关键技术语义Web的实现依赖于三大关键技术:XML、RDF和Ontology。XML实现了文档结构化,但文档信息并不包含任何语义;RDF数据模型提供了简单的语义;Ontology使得语义表达能力更加丰富。目前XML,RDF技术相对比较成熟,而本体技术尚待进一步的发展完善。17 语义web与知识管理1.XMLXML(ExtensibleMarkupLanguage)即可扩展标记语言,它与HTML一样,都是SGML(StandardGeneralizedMarkupLanguage,标准通用标记语言)。Xml是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML占用的空间比二进制数据要占用更多的空间,但XML极其简单易于掌握和使用。XML作为一种资源描述语言,因其灵活、通用、丰富的结构化信息表达方式,而被广泛接受,成为整个语义Web的基石。它可以让信息提供者根据需要,自行定义标记及属性名,从而使XML文件的结构能复杂到任意程度。它具有良好的数据存储格式和可扩展性、高度结构化以及便于网络传输等优点,再加上其特有的NS机制及XMLSchema所支持的多种数据类型与校验机制,使其成为语义Web的首要关键技术,也是整个体系结构的基础。Xml实例:      AnIntroductiontoXML  Chunbin  2010  98。0      ThePerformanceofDataBase  John  1996  56。0    17 语义web与知识管理上面的XML文档对应的树形结构如下:图片来源:百度百科2.RDF资源描述框架RDF(ResourceDescriptionFramework),一种用于描述Web资源的标记语言。RDF是一个处理元数据的XML应用,所谓元数据,就是“描述数据的数据”或者“描述信息的信息”。也许这样解释元数据有些令人难以理解,举个简单的例子,书的内容是书的数据,而作者的名字、出版社的地址或版权信息就是书的元数据。数据和元数据的划分不是绝对的,有些数据既可以作为数据处理,也可以作为元数据处理,例如可以将作者的名字作为数据而不是元数据处理。RDF是W3C组织推荐使用的用来描述资源及其之间关系的语言规范,定义了一种用以描述资源及其关系的模型,是语义Web实现的关键技术之一,也是语义信息描述的有效手段。它不仅是描述数据的框架,而且也是表示数据的框架。具有简单、易扩展、开放性、易交换和易综合等特点。RDF解决的是如何采用XML标准语法无二义性地描述资源对象问题,使得所描述的资源成为机器可理解的信息。通过RDF,人们可以使用自己的词汇表描述任何资源,但人们更乐意将它用于描述Web站点和页面,由于使用的是结构化的XML数据,搜索引擎可以理解元数据的精确含义,使得搜索变得更为智能和准确,完全可以避免当前搜索引擎经常返回无关数据的情况。当然前提是RDF和标准化的RDF词汇表在Web上广泛使用,而且搜索引擎需要能够理解使用的词汇表。17 语义web与知识管理简单而言,一个RDF文件包含多个资源描述,而一个资源描述是由多个语句构成,一个语句是由资源、属性类型、属性值构成的三元体,表示资源具有的一个属性。资源描述中的语句可以对应于自然语言的语句,资源对应于自然语言中的主语,属性类型对应于谓语,属性值对应于宾语。由于自然语言的语句可以是被动句,因此前面的简单对应仅仅是一个概念上的类比。RDF由3个部分组成:RDFDataModel,RDFSchema和RDFSyntax。RDFDataModel提供了一个简单但功能强大的模型,通过三元组<资源,属性,值>来描述特定资源。如:<"Tim",authorOf,"Book">表示Tim为Book的作者;<"Book",hasPrice,"$50">表示Book的价格是50美元。同时也有其他的表示方式:如可表示为authorOf<"Tim","Book">和hasPrice<"Book","$50">,也可以表示为有向图,如下图所示:RDF有向图模型定义为:(1)包含一系列的节点N;(2)包含一系列属性类P;(3)每一个属性都有一定的取值V;(4)模型是一个三元组:;(5)每一个DataModel可以看成是由节点和弧构成的有向图。RDFSchema使用一种机器可以理解的体系来定义描述资源的词汇,其功能就像一个字典,可以将其理解为大纲或规范。其作用是:(1)定义资源以及属性的类别;(2)定义属性所应用的资源类以及属性值的类型;(3)定义上述类别声明的语法;(4)申明一些由其他机构或组织定义的元数据标准的属性类。RDFSyntax构造了一个完整的语法体系以利于计算机的自动处理,它以XML为其宿主语言,通过XML语法实现对各种元数据的集成。3.Ontology语义信息的交流必须以共同的理解为前提,否则双方信息产生误解或者完全不理解。在语义Web中,这种“共同理解”是由Ontology建立和提供的。Ontology最早是一个哲学上的概念,从哲学的范畴来说,Ontology是客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。而在人工智能(AI)领域,Ontology是共享概念模型的明确的规范说明。Gruber给出的本体定义为:本体是共享概念模型的形式化规范说明。Fensel对这个定义17 语义web与知识管理进行分析后,认为本体的本质表现在4个关键词上:概念化(conceptualization)指通过抽象出客观世界中一些现象的相关概念而得到的模型;明确(explicit)指概念及它们之间的联系都有明确的定义;形式化(formal)指精确的数学描述,计算机可读;共享(shared)指ontology中体现的知识是共同认可的。语义Web可以看作是在本体理论基础上对当今Web所进行的扩展,使Web上的信息具有机器能理解的语义,同时在本体的支持下实现不同实体间语义层面的互通和互操作。本体从以下2个方面使Web发挥它的极大潜能:(1)本体为信息定义形式化语义以便计算机处理;(2)本体通过双方认可的术语,定义现实世界中的语义,将机器处理的内容与语义联系起来。4.XML、RDF与Ontology比较XML,RDF与Ontology居于语义Web体系结构的不同层次上,解决不同层面的问题。其中,XML主要是实现信息语法层面的互操作;RDF实现信息语义层面的互操作;而Ontology则是解决不同词汇相同语义及相同词汇不同语义的问题。三者在语义表示过程中相互补充,发挥了各自的优点。XML,RDF与Ontology对比图17 语义web与知识管理四、语义Web的逻辑基础要让机器能够理解并自动处理语义Web上的信息,首先需要解决的就是语义Web中知识表示和本体问题。语义Web是用本体表达语义的,语义Web中本体的使用需要一种合适设计(well-designed)、合适定义(well-defined)及Web相容的本体语言。鉴于描述逻辑(DescriptionLogics,DLs)在语义、可判定性以及面向对象的分类表示等方面的优点,一般的本体语言可以建立在描述逻辑的基础上。因此,一些学者将描述逻辑作为语义Web的逻辑基础。目前的标准OWL(OntologyWebLanguage)即是以描述逻辑为逻辑基础建立的用于表达语义Web的本体语言。1.描述逻辑描述逻辑是一种基于对象的知识表示的形式化。它是一阶逻辑的一个可判定的子集,具有合适定义的语义,并且具有很强的表达能力。描述逻辑是建立在2个基本元素——概念(Concept)和角色(Role)之上的,由构造子(Constructor)从简单概念和角色构造出复杂的概念和角色。其中,概念对应经典逻辑中的一元谓词(解释为一个领域的元素集合);角色对应二元谓词(解释为一个领域集合上的元素与元素的一种二元关系),构造子决定着语言的表达能力。如Parent(x)表示x是家长;has_child(x,y)表示x有孩子y;。PersonhasChildMale∩∀表示那些所有的孩子都是男孩的人。ALC是最基本的描述逻辑,包括如下构造子:交(∩),并(∪),非(),存在量词()和全称量词(¬∃∀)。描述逻辑是语法(syntax)+语义(semantics)的;语义是通过解释(,)III=Δ•来给出。其中,IΔ是解释领域(非空集合);I•是解释函数(将原子概念C映射到2IΔ的子集,将原子角色R映射到的子集)。17 语义web与知识管理ALC的语法和语义如下表所示:ALC的语法和语义在ALC的基础上添加不同的构造子,可以扩展成不同表达能力的描述逻辑。例如可以添加数量约束(字母N表示):≥nR(至少的限制),≤nR(最多的限制),得到ALCN;添加逆构造子(字母I表示):R−(角色R的逆),可以得到ALCI;加入模态算子可以扩展为动态描述逻辑(DDL)等,在此不作进一步的介绍。2.推理服务顾名思义,推理就是在已知知识的基础上发掘蕴含知识,即由显性知识得到隐性知识。要实现机器的自动处理,就必须具备对某些隐含知识的推理,同时推理对保障知识库一致性非常重要。基本推理问题主要有:一致性检测,概念可满足性检测,包含检测,实例检测等。其中概念可满足性检测关键推理,其他推理问题均可转换成概念可满足性问题。通常,一个知识库KB=。其中,TBox描述概念及其关系的术语公理集;ABox描述个体实例的断言公理集。对于TBoxT,ABoxA及解释(,)III=Δ•,定义:可满足:存在T的某个解释I,使得IC非空,则称C是可满足的;包含:对T的每一个解释I,都有IICD⊆,则;TCD⊆等价:对T的每一个解释I,都有IICD=,则;TCD≡相离:对T的每一个解释I,都有IICDφ∩=,则C与D相离。17 语义web与知识管理在描述逻辑中,可利用下面的定理来将其他推理问题转换为概念的可满足性推理。定理1(变形为可满足性检测)对于概念C和D,有:(1)CD⊆⇔CD∩¬是不可满足的;(2)CD≡⇔CD∩¬及CD¬∩都是不可满足的;(3)C和D是相离⇔C∩D不可满足的。描述逻辑是一簇知识表示语言,以结构化、形式化的方法来表示特定应用领域的知识。它是通过构造子将原子概念和角色来构建复杂的概念和角色,因此构造子对描述能力起着决定作用。研究各种构造子的表达能力及对应的推理复杂性是描述逻辑的研究核心,而如何在描述能力和推理的复杂性进行折中则是描述逻辑的根本问题。描述逻辑具有很好的建模和推理特性,已经成为Web本体描述语言的逻辑基础。它为语义Web本体语言提供形式化的基础和自动化的推理服务。五、语义Web的应用语义Web提供各种依靠语义的自动化服务,如天气预报服务、航班信息服务、在线航班预定服务、数据库查询服务、目录查询服务、数字图书馆查询服务、搜索和分类服务、B2C交易服务、B2B交易服务等。互联网信息发布与搜索:通过对内容的标注与分析从而克服了关键词查询的歧义性,提高了查询的精度。Stanford大学语义web研究组研制的查询语言DBQ是一个比较有影响的系统,它是基于DAML的。另一个基于DAML的语义web信息检索系统是美国Maryland设计的HOWLIR系统,它采用DAML-JESSDB-一个基于DAML的推理系统-作为推理引擎。此外,基于语义web的文档检索与知识管理也是当前研究的一个热点。Web问题解答:在用ontology对信息源进行标注的基础上,进一步运用知识库来解答用户的提问。Stanford大学研制的Triple系统是一个基于逻辑程序设计的RDF查询系统,逻辑子句的问题求解能力使它能够解答较为复杂的问题。德国Karlsruhe大学等单位研制的SEAL是一个语义Web门户网站,它具有回答用F-逻辑表示的查询的能力。F-逻辑使得ontology中的概念与问题求解规则融合于一体。17 语义web与知识管理六、基于语义Web的知识管理现有的知识管理平台工具贯穿了知识管理生命周期的各个方面,在实际中都取得了一定的成共应用成果,但是他们大都是在传统Web上得以开发,在信息全球化环境下的使用效率上存在信息搜索不准确,知识处理智能性差,可集成性差,协同性差等缺陷。针对以上情况,现在出现了一种见语义web技术应用于知识管理的趋势,使语义web成为知识创新管理的分布、开发、动态集成的大平台。以下将介绍语义web与知识管理的关系及如何引导知识管理为适应信息全球化环境下协同工作所进行的革命性创新活动。目前因特网在信息表达和检索方面的缺陷,主要在于它的设计目的是面向用户直接阅读与处理,而没有提供计算机可理解的语义信息,因此限制了在信息全球化的环境下计算机在知识管理过程中实施自动分析处理以及进一步智能信息处理的能力。此外,传统的本体描述语言KIF、Ontolingua、Loom和OCML等注重在知识工程过程中知识的共享和重用,但缺乏在本体概念之上的推理功能,不能被广泛地应用于互联网上的知识交换与共享。为解决网络化环境下有效的知识管理此一问题,以知识本体为核心的语义Web技术的研究已成为知识管理领域的最新热点所在。1.基于语义Web的知识表示传统的知识表示通常是集中式的,语义Web致力于建立一个支持知识在Web上的分布式表示但语义明确的知识空间。面向网络化应用又基于本体的知识表示语言的发展与Web语言标准本身的发展是分不开的。传统的Web是基于HTML语言来表示网上信息的,HTML的简单性使其所表达的信息缺少逻辑性因而限制了其对网上知识在语义方面的互操作能力——即使用智能Agent进行推理、共享知识服务并自发解答问题的能力。为了解决这一问题,语义Web从不同组织机构提出的各种知识表示语言到W3C标准,经历了以下几个阶段:SHOESHOE(SimpleHTMLOntologyExtension)是一种建立在HTML基础上的本体表示语言。SHOE对HTML进行了扩展,支持描述本体,可以表示概念、概念的分类、n元关系、常量以及推理规则等。17 语义web与知识管理OMLOML(OntologyMarkupLanguage)是美国华盛顿州立大学在以XML作为语法的SHOE的基础上开发的。OML建立在概念图基础之上,采用一阶逻辑对概念、分类、关系以及公理进行表达。OML由内到外由四个子语言组成:与逻辑有关的OML内核,与RDF(S)映射的简单OML,包含概念图特征的简化OML,以及具有最大表示能力的标准OML。XOLXOL(XML-basedOntologyExchangeLanguage)是美国SRI人工智能中心于1999年开发的的本体交换语言,最初用于生物信息学领域的知识交换。XOL是在Ontolingua和OML基础上,结合OKBC-Lite较高的表示能力而开发的。XOL能对概念、分类以及二元关系进行描述,但不具备推理机制。RDFRDF是W3C于1997年制定的一个建立在XML基础上对Web信息进行语义描述的语言规范,具有简单、易扩展、开放性、可扩充性和易集成性等特点。它采用三种对象来描述事物,即资源、属性以及声明。资源可以是指任何所描述的事物,通常采用URI以及ID来指明,属性是所描述资源的特征、品质以及关系等,而声明就是由前面所描述的资源、资源的属性以及属性的取值所组成的集合。RDF主要用来表达那些不仅被显示给人看而且可以被程序所处理的信息。RDF使用URIs来标识资源,并且用简单的属性和属性值来说明资源,这使得RDF可以在一个图形中用节点来表达资源,用圆弧来表达资源的属性。DAML+OILDAML(DARPAAgentMarkupLanguage)是美国DARPA于2000年8月开始的为代理之间提供基于语义上的互操作能力而开发的一种语言。它也以XML为语法,以描述逻辑为理论基础,并建立在已有标准RDF(S)之上。2000年12月,美国DAML和欧洲OIL两个组织成立联合委员会将DAML和OIL合并成一种语言,命名为DAML+OIL。DAML+OIL对于客观世界的描述主要分为概念和属性两个方面进行,与其相应的描述手段是面向对象域(objectdomain)的方式和面向数据类型域(datatypedomain)的方式。面向对象域的描述方式采用RDFS和DAML+OIL自身的语法进行,用于描述概念间分类化、层次化的继承关系以及相互间的关联关系;在进行面向数据类型域的描述时,DAML+OIL支持XMLSchema的所有数据类型进行概念属性的定义与表达。因此,DAML+OIL通过对概念、概念属性及其相互间关系的描述,构成概念的复杂关系网络。17 语义web与知识管理OWL2002年7月,W3C在DAML+OIL基础上发展了OWL语言,以使其成为国际通用的标准本体描述语言。OWL也建立在XML/RDF等已有标准基础上,通过添加大量的语义描述元语支持本体的描述与使用。OWL提供了描述属性和类的更丰富的表达方法,包括类之间的关系(如:disjointness)、重数之间的关系(如:exactlyone)、更丰富的属性关系(如:symmetry)和枚举类。OWL包含三种逐步复杂但自动化推理能力逐步降低的子语言:OWLLite、OWLDL、OWLFull。2.基于语义Web的智能Agent服务面向知识管理的智能Agent服务正从语义Web技术中受益。各种知识资源在语义Web上不再具有其在传统Web上产生的无序化、非结构化的缺陷,而是由一种结构化、逻辑化、本体化、语义化的方式来表示。面向知识管理的智能Agent便可以利用本体进行无歧义的语义级通讯,于是改进了其对网上资源进行搜索、获取和利用的方式。ITTALKS是美国Maryland大学开发的一个基于语义Web技术的多Agent原型系统,它能利用智能Agent来自动搜集Web中各类IT会议信息,并根据用户喜好和个人时间安排,提供个性化的个人会议助理服务。虽然各类IT会议信息往往是非形式化表示的,但其内容能够被基于各个本体的索引进行形式化、结构化的语义标注。而且这些本体并不是相互独立的,它们根据语义彼此关联,进而能够使ITTALKS中的各智能Agent通过相互关联的各个本体为用户提供智能化的知识应用服务。3.基于语义Web的知识集成有效的知识集成是维持组织竞争力的关键因素,组织间的数据交换、数据传送、信息共享一直是基于Web的知识管理的重要组成部分,现有的一些知识管理项目逐渐开始有围绕着基于本体的语义标注和知识集成展开的趋势。知识集成的重要基础就是利用基于语义Web的元数据对异构环境下具备不同数据格式和存储方式的应用系统和组织内部文档通过语义标注后融合信息和概念,例如对组织信息数据库按照同义、反义、上位、下位等进行概念的分类和聚类等。倪益华等利用OWL语言实现了基于本体的企业知识集成平台的构建,具体包括:知识分类、知识表示、知识构建、知识共享和知识集成。其本体结构以树形的层次目录结构显示,用户可以通过点击相应的项目来增加或编辑类、子类、属性、实例等,使用户在概念层次上实现了知识的集成。17 语义web与知识管理4.基于语义Web的知识检索面对WWW上的海量信息,如何进行智能的知识检索一直是知识管理的重要课题。现在所使用的HTML网页单调枯燥,仅仅负责把一个网页链接到另一个网页,使整个网络充满着混乱无序。XML网页虽对网页进行了结构化描述,但仍无法对网页的内容进行语义标注,以至缺乏实现基于内容的知识检索的智能化和自动化功能。语义Web技术将本体技术结合到Web技术中去,能够从HTML或XML中提取到具有语义的内容信息,实现自动化的知识挖掘、知识查询、知识搜索等使智能化知识检索成为可能。Ontobroker是德国Karlsruhe大学AIFB研究所开发的一个面向Web信息资源,能通过推理进行精确查询问答的工具环境。该系统的中心思想是:使用基于框架逻辑的本体结构描述背景知识,并在Web页面中嵌入本体标记语言HTML-A使文档表达的语义清晰化,形成计算机可理解的事实信息,通过Crawler自动提取页面中的事实信息;同时,用户查询也以框架逻辑形式表达,将上述两部分信息在系统内部转换为谓词逻辑后,通过谓词逻辑推理回答用户提问。在Ontobroker基础上,他们进一步实现了一个基于语义的信息检索门户站点SEAL(SEmanticportAL)。语义Web在W3C及其他研究机构的带领下,取得了巨大的进步,其应用领域不断拓广。虽然语义Web的逻辑基础很完备,其关键技术发展相对比较成熟,但整个体系结构的最高层——逻辑表示和处理层,尚待进一步的研究。要实现人们最初对语义Web的梦想,其要走的路还很远,面临的研究挑战还很多。如:内容的可获得性;本体的开发、合并及演化;语义Web语言的稳定性;证明和信任模型的开发等。参考网站:百度百科、维基百科等。参考文献:《语义web技术及其逻辑基础》(袁金平等著)、《Web服务与语义web服务》(吕勇全等著)等。17

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭