基于本体的web文档知识获取的框架研究

基于本体的web文档知识获取的框架研究

ID:30641974

大小:19.68 KB

页数:7页

时间:2019-01-02

基于本体的web文档知识获取的框架研究_第1页
基于本体的web文档知识获取的框架研究_第2页
基于本体的web文档知识获取的框架研究_第3页
基于本体的web文档知识获取的框架研究_第4页
基于本体的web文档知识获取的框架研究_第5页
资源描述:

《基于本体的web文档知识获取的框架研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果基于本体的Web文档知识获取的框架研究摘要本文在分析了Web文本的知识获取途径之后,提出了一个基于本体的Web文档知识获取模型。该模型具有较好的适应性和可移植性,模型使用了可扩充标记语言(XML),使得对知识库的处理更加简便。最后,通过一个临床实例对其流程进行了详细说明,并分析其在医院知识库系统中的应用。关键字知识获取;本体;Web文档互联网技术的发展为知识获取方

2、法的研究带来了机遇和挑战。必须发展相应的知识自动获取技术。为了使语义网应用到实际中给人们提供知识服务,就需要解决从Web文档中获取知识的问题。尽管从Web页面的注释中我们可以发现部分信息,然而所获得的信息是不全面的,而且很难能获取元信息。有研究者将本体的概念引入到知识发现领域[1][5],但还没有充分发挥到本体的优势。本文中本体以概念和关系来划分知识类型,并且以获取知识的本体为指导来从非结构化的Web文档中发现知识。互联网中存在大量的Web文档,其中记载着大量的信息。通过超链接逐页阅读相关文献来

3、查找所需信息是初级的且效率较低的知识获取方式。从文本中发现知识并提供给用户从技术上讲有两条主要途径:课题份量和难易程度要恰当,博士生能在二年内作出结果,硕士生能在一年内作出结果,特别是对实验条件等要有恰当的估计。从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果(1)传统的途径,即通过使用如归纳程序等工具直接获取文本中的知识,或通过知识工程师或领域专家使用知识编辑、编译工具间接获取知识,然后构造专家系统知识库,通

4、过专家系统间接为用户提供知识[2]。这种方法有如下不足:第一,专家系统知识库的表现形式不统一,存在知识难以共享的问题,且不适合逐页浏览;第二,在知识从文本转移到专家系统知识库过程中,存在信息丢失的弊端[3]。(2)自然语言技术,即直接从自然语言文本获取有用的知识并提供给用户[4]。但由于目前自然语言理解水平还比较低,主要是利用用户提供的样本进行训练,然后开发相应的程序来获取特定范围的知识。这种途径的缺点是有限的样本库资源限制决定了其应用范围的狭窄性。为此,需要有一种新的知识获取方法,它能以适当的

5、方式及时地将适用的知识从众多的文本提供给用户。将知识表示技术处理技术及XML技术标准结合起来,构成了一种新的知识获取途径。本体的基本概念本体的英文有两种写法:①大写开头的Ontology指哲学领域的本体论的概念。在哲学中Ontology是一种存在的系统化解释,用于描述事物的本质。本体论的概念和方法被计算机领域采用,用于知识表示、知识共享和重用。②小写开头的ontology是计算机领域广泛使用的概念,翻译为本体,是某领域内共享概念的明确的形式化规范说明。虽然本体还没有一个明确的定义,AI领域普遍认

6、同Gruber于1995年指出类似的概念:本体是“概念化(Conceptualization)的显式(Explicit)课题份量和难易程度要恰当,博士生能在二年内作出结果,硕士生能在一年内作出结果,特别是对实验条件等要有恰当的估计。从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果说明或表示”[6]。直观地讲,本体是一个实体,是对某一领域应用本体论的方法分析、建模的结果,即将现实世界中的某个领域抽象为一组概念及概

7、念之间的关系。基于本体的知识获取方法很多知识获取系统(如IE)能识别一些文档实体,例如张三是一个人,XX年6月是一个日期,但是如果不将这些信息通过它们之间的关系联系起来,就没有太多的实用价值了。因为它不能表达出张三出生于XX年6月的完整含义。这就要求有一种自动处理机制用于发现实体之间的关系,也就是要求信息向本体转化。基于本体的知识获取模型将知识获取工具与本体联系在一起,用本体来支持和指导知识获取,是零散的信息集中到一起形成知识,以不断地获取知识。知识获取工具通过搜索Web文档,将那些能与给定的规

8、则结构匹配的知识提取出来,然后将它格式化为一种便于机器阅读的格式(如XML),并将它存入知识库(KnowledgeBase)。在知识获取过程中起指导作用的本体本身也要采用一种字典扩展机制来扩展本体集合。基于本体的知识获取模型课题份量和难易程度要恰当,博士生能在二年内作出结果,硕士生能在一年内作出结果,特别是对实验条件等要有恰当的估计。从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果基于本体的知识获取模型包括知识

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。