基于本体地自然语言检索研究.pdf

基于本体地自然语言检索研究.pdf

ID:57751727

大小:88.00 KB

页数:2页

时间:2020-03-28

基于本体地自然语言检索研究.pdf_第1页
基于本体地自然语言检索研究.pdf_第2页
资源描述:

《基于本体地自然语言检索研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、科技信息计算机与网络基于本体的自然语言检索研究大连民族学院图书馆寇清华郑巧红[摘要]本文分析了自然语言检索的优缺点,介绍了自然语言检索与本体结合的优势,对本体的构建规则进行了介绍,最后提出了构建本体的方法。[关键词]自然语言检索本体本体构建随着计算机、网络与信息技术的迅猛发展,信息的产生、发布速度Studer等人在对本体做了深入研究后,扩展了Gruber的定义,认为“本日新月异,使得现在的Internet和Web上具有海量的信息资源。而随着体是共享概念模型的明确的形式化规范说明”。这一定义已被大多数人计

2、算机和网络的普及,人们的信息意识也在不断增强。各行各业的人们认同,该定义包含了四层含义:都深刻意识到信息的重要性,对信息的需求也越来越迫切,信息用户群(1)概念模型(Conceptualization),即本体是通过抽象客观世界的概从原来的只有少数专业人员范围发展到了全民范围。面对庞大的网络念而得到的模型,该模式定义了概念间的相关关系;信息资源如何进行有效地组织,并提供快捷、方便的检索服务,已经成(2)明确性(Explicit),即本体所使用的概念及这些概念的上位类之为信息检索领域亟待解决的问题。常规的

3、全文检索方式虽然可以保证间都应该有明确的定义和说明,没有二义性;查全率,但是查准率却大大降低,而基于数据库的检索方法,其性能取(3)形式化(Formal),即本体是计算机可处理的,而不是自然语言;决于所使用的字段标识方法和用户对方法的理解,对于大多数没有经(4)共享(Shared),即本体体现的是共同认可的知识,反映的是相关过检索培训的用户来讲,操作起来费时费力,具有很大的局限性,也不领域中公认的概念集合,应该被整个领域的群体所接受。能满足用户在语义上和知识上的需求。而自然语言检索具有方便、快本体的目标

4、是捕获相关的领域的知识,提供对该领域知识的共同捷、易于操作的特点,成为信息检索领域一大发展趋势。现在自然语言理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给检索系统可望扫除人与计算机系统的接口障碍,只是对自然语言如何出这些词汇和词汇之间相互关系的明确定义,利用本体概念化、形式进行分解取得准确的语义问题还有待更深入地研究[1]。从2001年开始,化、明确性、共享性的特性来提高信息检索的准确性与覆盖率,从而将一些专家、学者开始把本体理论应用到自然语言检索领域。本体具有能Web上的所有信息,连结

5、成一个巨大的数据库。通过概念之间的关系来表达概念语义的能力,因而在信息检索,特别是3自然语言检索与本体结合的优势在基于知识的检索中支持知识上、语义上的匹配,对检索系统的查全率本体是关于领域知识的概念化、形式化的明确规范,是对领域知识与查准率有更好的保障。本体的最大优势还在于本体将某个或多个特的共同理解与描述,它和情报检索语言一样由概念及其之间的相互关定领域的概念和术语规范化,提供了人机交流的机制,使得机器可以理系构成,所不同的是构成本体的概念更加系统、全面地揭示概念之间的解语义,达成机器与机器之间、机器

6、与人之间的语义互操作。要实现对相互关系,具有更强的表达能力。因而本体更适用于网络环境下的信息Web上的知识信息的重用与共享,充分挖掘语义Web的潜力,就需要资源组织与检索。其优势主要体现在:大规模采用基于本体的方法来组织信息资源。本文首先介绍了自然语(1)本体同样也具有标引功能、信息组织功能、对信息进行集中并言检索的优缺点及本体的概念,然后论述了自然语言检索与本体论结显示其相关性的功能,本体可以替代情报检索语言对自然语言加以更合的优势,最后提出了开发本体的方法。好的控制。1自然语言检索的优缺点(2)本体

7、比传统的情报检索语言更加深入、全面、细致地反映了概1.1自然语言检索的优点念之间的关系,同时在组织结构上,本体中的概念构成了一个语义网使用自然语言检索不受繁琐的检索规则限制,检索标识从源文的络,提供了一个共享的词汇库,以达到人机之间交流顺畅、且不会丢失题名、文摘和正文中提取,符合大多数用户的检索习惯,用户使用自然曲解交流信息所包含的语义。语言描述他们的信息需求,用能准确反映自己意图的词语作为检索标(3)本体中的概念用自然语言或半自然语言表达,应用更广。本体识[2]。自然语言检索的优点可归纳为三个方面:的

8、描述能力可以解决同名异义及异名同义,描述概念间的相互关系,显(1)自然语言检索不受词表限制,可以输入新生词汇,更有效地跟示描述概念的语义,支持相关信息源之间的信息交换,提高应用的互操踪新事物的发展。作性,促进领域知识共享和重用,可以实现基于本体的语义检索或自然(2)自然语言检索以源文的内容作为检索标识,符合大多数用户的语言检索。检索习惯,不受专业及使用检索系统能力的限制,能更快、更准确地命(4)本体是一个开放的体系,其概念集可以随着学科领域

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。