浅谈基于lucene搜索引擎库的本体映射方法的研究与实现

浅谈基于lucene搜索引擎库的本体映射方法的研究与实现

ID:34819034

大小:5.39 MB

页数:66页

时间:2019-03-11

浅谈基于lucene搜索引擎库的本体映射方法的研究与实现_第1页
浅谈基于lucene搜索引擎库的本体映射方法的研究与实现_第2页
浅谈基于lucene搜索引擎库的本体映射方法的研究与实现_第3页
浅谈基于lucene搜索引擎库的本体映射方法的研究与实现_第4页
浅谈基于lucene搜索引擎库的本体映射方法的研究与实现_第5页
资源描述:

《浅谈基于lucene搜索引擎库的本体映射方法的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、2009届研究生硕_L学位论文学校代码:10269学号:51061211007·季束师托带基于Lucene搜索引擎库的本体映射方法的研究与实现院系:信息科学与技术学院计算中心专业:计算机应用技术研究方向:现代软件技术指导教师:朱敏高级_〔程师硕仁研究生:陶艳琳2008年12月完成2009届研究生硕士学位论文学校代码:10269学号:51061211007·季束呼托术带基于Lucene搜索引擎库的本体映射方法的研究与实现院系:言言息科学与技术学学院刻刻专业:研究方向:指导教师:硕士研究生:2008年12月完成2009’5DissertationforMasterofSeieneeDegree

2、SehoolCode:10269S加dentNo:51061211007·季束师托术带ResearchandImPlementationofanOntologyMaPPingaPProaehbased一onLueeneSearchEngineDePartment:Major:ResearChArea:SuPervisor:MinZhuCandidate:YanlinTaoNovembe几2008Shanghai学位论文独创性声明本人所呈交的学位论文是我在导师的指导下进行的研究工作及取得的研究成果.据我所知,除文中已经注明引用的内容外,本论文不包含其他个人已经发表或撰写过的研究成果.对本文的

3、研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢意.作者签名:日期学位论文授权使用声明本人完全了解华东师范大学有关保留、使用学位论文的规定,学校有权保留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版。有权将学位论文用于非底利目的的少量复制并允许论文进入学校图书馆被查阅。有权将学位论文的内容编入有关数据库进行检索.有权将学位论文的标题和摘要汇编出版.保密的学位论文在解密后适用本规定。学位论文作者签名:殉她琳导师签名:日期日期尹尹叶呀‘‘l夕,l胸艳巫硕士学位论文答辩委员会成员名单姓姓名职称称单位备注注器器瓜孰嫂嫂物沁树主席席绷绷欢妈;;枷粼娜补脚脚沁〕〕加牛牛捧含喊

4、枷粼粼、华东师范大学硕士论文基于Lucene搜索引擎库的本体映射方法的研究与实现摘要随着语义网络的迅速成长,涌现和积聚了很多语义信息。然而,因为语义网络分布的自然性,语义网络上的数据不可避免地来自于不同的本体。本体之间的信息加工处理不可能脱离了它们元素之间的语义映射而进行。用手工来发现映射是单调的,易错的,而且很明显在网络范围上是不切实际的。然而,通过本体,代理(人类和软件)可以以一种(半)自动的方式来进行互动,以利用语义来查找信息。因此,本体映射成为了基于语义技术中的一个关键问题。开发本体映射(。ntofogyMaPPing)工具,就成为了语义网络成功的关键因素,它是未来互联网环境下数据

5、集成与管理的有效途径。本体映射算法是以两个本体作为输入,然后为这两个本体中的各个元素(概念、属性或者关系)建立相应的语义关系。本文着重于本体映射问题,尤其是考虑本体用RDF(ResoureeDescriptionFramework资源描述框架)或oWL(研几bOntologyLanguage网络本体语言)来描述。虽然本体之间的一些特征完全不同,但是本体映射的方法却存在着共同点。在大多数情况下,本体映射是利用语言层和结构层信息,来找出两个不同本体(源本体和目标本体)的URlrefs(universalResourceIdentifierReferenceURI引用)之间的映射。虽然结构匹配很

6、重要,但是它主要是基于语言之间的匹配。本文首先在前三章简要介绍了本体及本体映射的概念,阐述了本体映射的主要方法,列举了目前国际上主流的几种本体映射方法和本体映射工具,并且详细阐述了Lucene搜索引擎库的主要机制,对其索引机制进行了深入探讨。在后面的章节中,着重介绍了本文提出的一种基于Lucene搜索引擎库的本体映射方法,称之为LseloM(Lueenesearchenginelibr娜ontolo盯M卿ing)。并对其进行了实现,最后通过实验对其的性能进行了评估。本文利用Lucene的特点和性质,首先对源本体进行解析,利用解析结果对源本体建立索引,在索引中,Lueene文档收集了关于UR

7、frefs语言层上的信息(包括局部名、描述信息和属性名,属性值等)。然后利用目标本体的URfrefs作为搜索条件,针对源本体建立的索引进行搜索,从而得到映射,将映射结果输出到Lucene的结果集中。本文的特点是,在搜索过程中,方法结合语言层上的两种匹配方法:基于语义匹配的方法和基于字符串匹配的方法,在基于字符串匹配的方法中,本文利用I一Sub算法来实现对于字符串的匹配,而基于语义匹配的方法中,本文利用Lucene的特性,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。