基于本体的语义搜索研究综述

基于本体的语义搜索研究综述

ID:27331573

大小:57.00 KB

页数:7页

时间:2018-12-02

基于本体的语义搜索研究综述_第1页
基于本体的语义搜索研究综述_第2页
基于本体的语义搜索研究综述_第3页
基于本体的语义搜索研究综述_第4页
基于本体的语义搜索研究综述_第5页
资源描述:

《基于本体的语义搜索研究综述》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于本体的语义搜索研究综述基于本体的语义搜索研究综述1引言语义网的目标是扩展现有的.收集整理,以便下次更容易地查找。索引的目的是为了加快匹配过程。索引的分类:(1)转发索引:存储每个文档的单词列表。(2)倒排索引:为每个单词存储所有文档的列表。(3)图索引:给定一个查询图,查找索引并检索答案集,验证哪些图包含查询图,返回查询结果。4)排名排名取决于查询结果的排序过程。搜索引擎会请求匹配和并为查询结果进行排名。匹配是选择元素的子集进行评分。排名是由相关概念的相似度决定的。排名是在句法/语义映射完成后,依据网页的评分进行计算得来的。最后

2、将已经排序好的网页结果进行索引之后返回给网页的使用者。排名模型的类型如下:(1)句法排序模型:是依据查询关键词与搜索引擎数据库相匹配而进行的搜索,从TF-IDF到谷歌PageRank,这些著名的信息检索排名技术丰富了这种搜索的排名方法。(2)语义排序模型:搜索是基于结果的相关性,缩小了语法和语义之间的差距,根据相关性得到的结果集,可以更好的满足用户的需求。5)信息检索模型(IR模型)IR模型的作用是提供一个形式化的信息发现过程。下面是3种IR模型:(1)布尔模型–一方面是基于关键词的查询,另一方面用关键词的组合表示一个文

3、档,用关键词的逻辑描述表示一个查询(2)矢量模型–表示用户查询和文档中的所有关键词形成的空间矢量。(3)概率模型–采用基于概率理论的数学模型。6)性能改进基于本体的语义搜索方法的性能可以用一定的标准来衡量,如查准率,查全率,F值和平均查准率。查准率和查全率的值介于0和1之间,最大值为1。应用本体的背景知识库进行查询,可以使查准率和查全率得到提升。3不同的搜索方法经过大量4)基于本体的信息检索中向量空间模型的适用性这种方法包含一个基于本体的用于文档半自动语义标注的模型和一个检索系统[6]。在文档中,通过多个领域

4、本体的概念描述,创建了知识库,并关联到相关的信息资源或文档。KIM是一个语义信息扩展和检索的平台[17],在这个平台上创建了KB系统,能够对文档进行自动化的语义标注。索引和排序是通过标注权重并使用向量空间模型的信息检索方法来实现。5)基于本体的用户配置文件的学习:基于语义的个性化antic:具有轻量级关键词接口的语义搜索这种方法类似于SPARK方法和使用本体对关键词解释的语义搜索方法,但它解决了可扩展性问题,提出了一种新的聚类图的结构对应于原始本体的概要[10]。它的查询结果排序采用多种机制,比如查询长度、与查询相关的本体元素相关性

5、和本体元素重要性。索引采用的是倒排索引和查询索引。排序是基于本体元素(是概念,而不是关系和属性)的关键词匹配。9)对传统的信息检索和基于本体搜索模型进行交叉比较的TREC方法Fernandez等人比较了传统的信息检索模型和基于本体的搜索模型,使用的标准包括:(1)一个文本文档集(2)查询集和相应文档相关性的判断集。(3)本体集和覆盖查询主题的知识库。文档集和查询集、判断集是信息检索论坛和TREC(文本检索会议)网站中使用最广泛的数据集[11]。作为一个应用案例,它所应用的标准是基于本体的搜索模型和TREC9、TREC2001中最好的

6、信息检索系统。它使用RDF、OL构建本体,在背景知识库中进行自动化语义标注。10)提高元数据库的数据发现机率的语义搜索带Metacat元数据系统的语义搜索系统能够存储OED-CT本体的医学领域知识库,提高了查询的准确度[13]。根据基于SNOMED-CT本体而定义的医学概念,将查询词和文档进行转化。将超过平均精度基线25%的关键词进行倒排索引和语义相关度排名。12)基于本体的WEB查询结果的语义排序方法这是一个新的基于语义的方法,提供了信息检索系统的评价方法[14]。我们的目标是增加搜索工具的选择性和改善这些评价和证明,它是提高搜索

7、引擎的性能和返回结果的相关性的有效途径。WordNet本体用于提取查询术语和语义预测,并基于由概念(非单词)组成的语义向量构建向量模型。13)使用RDF为同一类产品设计一个基于领域本体的特定网页搜索引擎这种方法使用一种新的搜索模型,可以存储特定领域中的特定网页的RDF信息,提供更完整、全面的信息输出,搜索引擎可以从搜索结果页面中得到产品的基本信息,而不需要访问搜索结果链接,从而节省搜索时间以及网页的下载的时间[15]。这个模型通过本体概念的语法和权重计算下载页面的相关度,根据相关度大小为查询结果排序。14)OntDR:一个扩充的基于

8、本体的文档检索方法这种方法提出了基于本体的文档检索的扩充方法,这种本体带有数组索引[16]。数组索引有助于获得文档之间的关系。数组索引通过本体定义的概念所产生的值和文档进行比较而得到。4评价按照分类标准比较文中所选的基于本体的搜索方法

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。