欢迎来到天天文库
浏览记录
ID:32601855
大小:3.49 MB
页数:50页
时间:2019-02-13
《基于本体的语义检索技术研究 (1)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第1章绪论究15J,他们目前从事的研究重点是构建基于本体的知识门户和语义门户。美国斯坦福大学的知识系统实验室,无论是在本体建模工具领域,还是在本体应用层面的研究方面,都站在了知识工程领域的最前沿。除此之外,国外研究基于本体检索加工的学者和机构还有西班牙萨拉戈萨大学的Eduardo和巴斯克大学的Arantza,以及美国佐治亚大学大规模分布式信息系统实验室【6】和美国德克萨斯大学计算机系的基于知识系统研究小组等。国内对本体的研究起步比较晚,主要研究内容包括产品信息建模、虚拟企业建模【71、常识知识库[81等。徐振宁【9-111等人把本体作为信息检索系统的核心,通过构造形
2、式化的领域本体,提出了一种将知识表示和知识处理引入互联网信息处理的方法,为互联网上半结构化数据和关系数据库提供了统一的语义模型。中科院计算所智能信息处理开放研究室建立的基于本体论和多主体的信息检索服务器【121利用了多智能主体和本体理论设计。宋峻峰【13】提出的基于本体的信息检索模型采用了描述逻辑作为构造本体的本体语言,使用本体中定义的词汇来标记文档,生成基于本体的文档逻辑视图和用户信息需求逻辑视图,从而可以实现语义层次的检索,使检索性能大大改善。浙江大学人工智能研究所对基于本体的产品信息进行了深入研究【H】。重庆大学的张英海【15】等在基于关键词和概念分析的基础上
3、,提出了一种基于语义概念模型检索的向量空间模型。台湾的蕖俊儒在基于模糊逻辑的基础上,提出了模糊本体的概念,并给出了模糊本体自动生成框架,用于处理文档中存在的不确定信息。1.3课题的主要研究内容在综合分析当前本体国内外研究现状,信息检索系统存在问题以及本体技术的基础上,本课题以研究本体的理论和技术为基础,研究如何在领域本体的基础上提高信息检索查询质量,并针对现有的非结构化或半结构化的信息,在基于传统的信息检索系统结构的基础上,本文提出了一个基于模糊本体的语义检索向量空间模型,详细阐述了基于模糊本体的语义索引、文档预处理和查询扩展等。详细研究了概念检索中的关键部分一概念
4、映射技术,并实现了基于本体的信息检索系统。1.4论文创新点课题研究中本人的主要工作和创新点如下:(1)课题将数据流挖掘技术引入到智能检索领域,将进一步提高智能检索技术实时分析能力及对大规模数据的检索能力。(2)在很多应用领域中,由经典本体支持的形式化概念不足以表示不确定信2山东轻T业学院硕上学位论文息,本文在研究模糊逻辑相关理论的基础上,提出将模糊逻辑隶属度加入概念相似度计算公式,以提高查询速度和准确率。(3)针对传统向量空间模型存在的缺陷,本文拟提出了一种基于模糊本体的语义检索向量空间模型,并对该模型相关技术进行了详细介绍。(4)课题研发一个文本分析工具的原型。该
5、工具将能对word、excel、pdf文件进行关键词有效检索,并能对特定领域(计算机取证领域)相关词汇进行语义检索。1.5文章组织结构全文共分六章,具体结构为:第一章,绪论。介绍该论文的选题目的和研究意义,阐述本体国内外研究现状、本课题主要研究内容以及论文主要创新点。第二章,探讨了信息检索的基本原理,详细阐述了信息检索技术涉及的信息表示、信息检索过程和信息检索结果三个方面。第三章,阐述了本体技术的定义、分类、构成、表述语言、本体的建模原语和构建工具等八个方面,以及本体在信息检索中的应用。第四章,构建了基于领域本体的信息检索系统结构模型,阐述具体实现过程和主要算法。第
6、五章,对模糊本体概念映射进行了深入的研究,并实现基于本体的信息检索系统。第六章,对研究内容进行总结与对未来研究的展望。第2章信息检索技术本章首先介绍了信息检索模型的概念,探讨了信息检索的基本原理,然后详细阐述了信息检索技术涉及的信息表示、信息检索过程和信息检索结果等三个方面的内容,最后概括了当前信息检索存在的不足。2.1信息检索模型的概念信息检索是信息资源与信息需求的匹配过程,是通过~定的算法寻找信息资源与信息需求的交集的过程。由于信息资源空间和信息需求空间的不确定性,信息检索是信息需求向信息资源不断靠近的过程,是一个摸索的过程,是一个逐步求精的过程【l6,17J。
7、信息资源是实现信息检索的基础,原始的文档中包括文本、图像、视频、音频等数据,不能直接进行检索,需要从这些原始数据中抽取逻辑视图,支持信息检索。用户用查询来表示他的信息需求。检索系统根据查询的表示,搜索文档集,获取与用户查询相关的文档。信息检索的匹配是相似度匹配,查询的结果按序返回。以上过程实际上涉及个重要的处理文档集和查询的表示、相似匹配及排序。对这些检索的因素和过程建模,我们把信息检索模型定义为:一个信息检索模型是将文档表示、查询以及它们之间的关系进行建模的框架,它由三元组表示:FED,Q,R(qi,dj)】式(2.1)其中D是文档集中的一组文档逻辑视图(或称
此文档下载收益归作者所有