基于xml的元数据近似匹配模型研究

基于xml的元数据近似匹配模型研究

ID:33790559

大小:2.62 MB

页数:74页

时间:2019-03-01

基于xml的元数据近似匹配模型研究_第1页
基于xml的元数据近似匹配模型研究_第2页
基于xml的元数据近似匹配模型研究_第3页
基于xml的元数据近似匹配模型研究_第4页
基于xml的元数据近似匹配模型研究_第5页
资源描述:

《基于xml的元数据近似匹配模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工程硕士学位论文摘要XML技术和元数据技术作为资源对象描述与检索的基础,正在众多领域中得到广泛研究与应用,尤其基于XML的检索技术研究方兴未艾。目前虽有许多面向XML文档的检索方案被提出,但它们都不能在高效率的情况下保证资源的查全率与查准率,难以满足用户多样性的检索需求。本文围绕查全率和查准率的效率问题,引入树匹配思想,对基于XML的元数据检索进行了深入的研究。本文首先系统地讨论了基于XML的信息检索技术的基本原理和方法,研究了XML检索技术的发展现状,对信息检索中的树匹配理论和相关问题进行了深入探讨。为提高查全率,本文把无序标签树匹配分解为树结构匹配和标签语义匹配,

2、采用树结构匹配和语义匹配相结合的方法,对传统树匹配算法进行了改进,提出了近似匹配的概念。针对元数据XML描述的树型结构特征,本文设计了一个由树嵌入近似匹配、树包含近似匹配、树包容近似匹配共同组成的三层近似匹配模型,此模型可根据用户的不同需求有效地调节元数据的查准率和查全率。由于传统的无序标签树的包含问题是一个NP难问题,所以本文在近似匹配模型中根据树匹配检索的结构化特征,通过加入节点之间亲和度的限制条件,使得包含近似匹配代价的计算问题可以在多项式时间内得到解决。本文引入树编辑距离、映射代价等相关理论和动态规划的思想,详细分析了近似匹配模型的匹配代价计算问题,证明了三类

3、近似匹配问题可在多项式时间内求解.最后,本文利用近似匹配模型以及匹配代价计算,设计了基于XML的元数据查询系统的体系结构和检索过程,构建了元数据查询系统的原型系统,并进行了一系列实验,实验结果表明:近似匹配模型能很好地将查全率和查准率结合起来,在元数据检索的实际应用中具有可行性和有效性。关键词:XML;元数据检索;近似匹配:匹配代价:匹配模型基于XML的元数据近似匹配模型研究AbstractAsthebaseofdescriptionandretrievalofresourceobjects,XMLandmetadatatechnologieshavebeenwide

4、lyresearchedandappliedinallkindsoffields.Thoughmanyexpertshaveespeciallyfocusedonthestudy-ofretrievaltechnologyonXMLandmetadata,butstillnoefficientretrievalmethodscouldensuretheaccuracyandrecallrate.ThisthesisaimsattheefficiencyproblemofaccuracyandrecallrateinXMLretrieval.Basedontreemat

5、ching,thethesismakesafurtherstudyontheXMLretrievaltechnologyaboutmetadata.ThisthesisintroducesthebasictheoryandmethodaboutXMLinformationretrieval,andstudiesthedevelopmentofXMLretrievalmethods,especiallyaboutthetreematchingtheoryandrelativealgorithms.InordertoimprovetherecallrateinXMLret

6、rieval,thisthesistakesaparttheunorderedlabeltreematchingintotreestructurematchingandtreelab-elsemanticmatching.Thisthesischangestheclassicaltreematchingalgorithmsintoapproximatematchingbycombiningthetreestructurematchingwithsemanticmatching.Accordingtothetreecharacteristicsofmetadatades

7、cription,itputsforwardametadataretrievalmethodbasedontreeapproximatematchingandgaveoutanewretrievalmethodbasedonthree-leveltreeapproximatematchingmodel.Thisretrievalmethodcanadjusttheaccuracyandrecallrateofsearchingmetadatabydifferentusers.Becauseofusingtheconceptionofeditiondi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。