wiki百科全书中非父子语义关系抽取研究

wiki百科全书中非父子语义关系抽取研究

ID:34837074

大小:3.21 MB

页数:42页

时间:2019-03-12

wiki百科全书中非父子语义关系抽取研究_第1页
wiki百科全书中非父子语义关系抽取研究_第2页
wiki百科全书中非父子语义关系抽取研究_第3页
wiki百科全书中非父子语义关系抽取研究_第4页
wiki百科全书中非父子语义关系抽取研究_第5页
资源描述:

《wiki百科全书中非父子语义关系抽取研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、上海交通大学硕士学位论文表格目录表4-1:对关系实例的评价结果....................................................................................................30表4-2:对概念层抽象的评价结果...............................................................................................3110上海交通大学硕士学位论文上海交通大学学位论

2、文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:张杰日期:2007年1月24日2上海交通大学硕士学位论文上海交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人

3、授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年解密后适用本授权书。本学位论文属于不保密√。(请在以上方框内打“√”)学位论文作者签名:张杰指导教师签名:俞勇日期:2007年1月24日日期:2007年1月24日3上海交通大学硕士学位论文第一章引言研究背景本体(Ontology)的概念最初起源于哲学领域,可以追溯到公元前古希腊哲学家亚里士多德(384-322b.c.)。它在哲学中的定义为“对世界上客观存在物的系统地描述,即存在论”,是客观存在的

4、一个系统的解释或说明,关心的是客观现实的抽象本质[1]。在人工智能界,最早给出Ontology定义的是Neches等人,他们将Ontology定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”[1]。Neches认为:“本体定义了组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则。”1993年,Gruber给出了Ontology的一个最为流行的定义[2],即“Ontology是概念模型的明确的规范说明”。后来,Borst在此基础上,给出了Onto

5、logy的另外一种定义[3]:“Ontology是共享概念模型的形式化规范说明”。Studer等对上述两个定义进行了深入的研究,认为Ontology是共享概念模型的明确的形式化规范说明。这包含4层含义[4]:概念模型conceptualization)、明确(explicit)、形式化(formal)和共享(share)。“概念模型”指通过抽象出客观世界中一些现象(Phenomenon)的相关概念而得到的模型。概念模型所表现的含义独立于具体的环境状态。“明确”指所使用的概念及使用这些概念的约束都有明确的定义。“形式化”指Ontolo

6、gy是计算机可读的(即能被计算机处理)。“共享”指Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集,即Ontology针对的是团体而非个体的共识。Ontology的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。本体作为一种用来形式化、显式地描述领域内共享知识的表达方式,成为了实现语义万维网的基石。最近几年万维网联盟颁布了两个在万维网上发布和共享本体的标准:RDF(ResourceDescription

7、Framework,资源描述框架)[31]和OWL(WebOntologyLanguage,万维网本体语言)[32]。这些语言框架从整体上定义了一套完整的语义系统,符合了前人对本体所描绘的定义和目标。目前对本体的应用已有很大的发展,主要有以下两方面的引用:(1)本体在信息系统中的应用,主要包括处理信息组织、信息检索和异构信息系统互操作问题;(2)本体作为一种能在知识层提供知识共享和重用的工具在语义web中的应用。对本体的应用自然而然提出了对本体数据的需求。手工建造本体的手段是最直观容易想到了,而它缺有着诸多的缺陷:由于人力资源的有限

8、性,使得建立的本体不能完整的描述所期望的领域,同时对于人力的需求巨大,这是一件费时费力的工作;由于人工的标注,其天然含有易出错的特点;本体的更新需要人的动作,使得本体不能及时反应事实世界的变化。正因为如此,使得对能有效减少本体产生阶段

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。