面向XML数据语义检索关键技术研究

面向XML数据语义检索关键技术研究

ID:36803462

大小:2.55 MB

页数:64页

时间:2019-05-15

面向XML数据语义检索关键技术研究_第1页
面向XML数据语义检索关键技术研究_第2页
面向XML数据语义检索关键技术研究_第3页
面向XML数据语义检索关键技术研究_第4页
面向XML数据语义检索关键技术研究_第5页
资源描述:

《面向XML数据语义检索关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要随着信息技术的迅猛发展,人们可以通过互联网不断地从世界各地交换信息,同时,XML也成为了网络上各种应用程序交换异构数据的新兴标准。面对大量XM【。数据的涌现,XML数据检索表现出了越来越大的研究价值。与传统的HTML检索不同的是XML检索返回结果是XML文档片段,而HTML检索返回结果是整个HTML网页。近年来,许多基于XML数据树模型的检索算法被相继提出,这些检索算法普遍存在的问题是人们仅仅从XML数据本身的结构特点去研究,没有从语义的角度去考虑检索问题,从而导致了查询返回结果无法充分满足用户的查询需求。本文提出了基于语

2、义关联空间的XML检索算法和基于最大重复语义单元的检索算法来解决这个问题,本文的研究内容和研究特色如下:(1)在自然语言理解中,由于表达方式的差异,导致存在一词多义、同义、近义、歧义等现象,因此字符串匹配不等同于语义匹配。针对此现象,本文提出了语义关联空间的概念和相应的XML检索算法,以提高查询算法的性能和检索效果。(2)通过大量的研究和观察,我们发现大多数的XML数据文件含有大量的重复结构,体现了这些用来描述实体的重复结构在语义上具有一定的完整性和相似性。针对此现象,提出了最大重复语义单元的概念和相应的xML检索算法,以使查询算

3、法返回结果粒度大小适中的xML文档片段。本文提供了大量基于真实数据和人工数据的实验结果都证明了基于语义关联空间的xML检索算法和基于最大重复语义单元XML检索算法在查询性能方面与当前其他检索算法相比具有明显的优越性。关键词:XML语义关联空间重复语义单元语义检索摘要ABSTRACTWimtherapiddeVelopmentofInfonllationteclulology,peoplecanexchaIlgethem幻nIlatlonf酌malloVertheworIdt11rou曲theInt锄et,a11dXMLhasbec

4、omeasadefactostandardforheterogeneousdataexchangebetweenvariousapplicationsontheIntemet·Facedwiththeeme唱enceofaIargenumberofXMLdata,XMLdataretnevalshowsagrowingresearchValue.111edifferencebetWeenthetraditionalHTMLretrieValandXMLrefrieValisthattheresultsofXMLretrievala

5、reXMLdocument行agments柚dtheresultsofHTMLretrievalarechewholeHTMLdoc啪entS.Inrecentyears,Eno珊ousXMLdataretrievalalgorit№swhichbasedontreedatamodelhavebeenpr叩osed。AcommonproblemofthoseeXistingXMLretneValalgorithmsisthattheyonlystudy抒omthestructuralcharactedsticsoftheXIⅥLd

6、ataitselfandnot行omasemanticpointofviewtoconsideftheretrieva】problems,whichleadtomequeryresultscan’tadequatelymeettheneedsoftheuser’squery.上nthlspaper,weproposeXMLretrieValalgorithmbasedonsemaJlticassociationspaceandXMLretrieValalgorithmbasedonmaximumrepetitivesemantic

7、unittoaddressthisproblem.Themainresearchcontentandcharacteristicofthethesisareasfollows:(1)Innaturallanguageunderstanding,duetothedifI-erenceofexpression,leadtotneexlstenceo士polysemy,syllon舯y,near—synon舯s,锄biguousandsoon,sothestnngmatchingisnotequiValenttosemanticmatc

8、hing.Forthisphenomenon,weproposetheconceptofsemanticassociationspaceandthecorrespondingXMLretrieValalgorimmsinordertoimprove

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。