一种混合时态xml索引模型研究

一种混合时态xml索引模型研究

ID:33157737

大小:1.41 MB

页数:51页

时间:2019-02-21

一种混合时态xml索引模型研究_第1页
一种混合时态xml索引模型研究_第2页
一种混合时态xml索引模型研究_第3页
一种混合时态xml索引模型研究_第4页
一种混合时态xml索引模型研究_第5页
资源描述:

《一种混合时态xml索引模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、华中师范大学硕士学位论文一种混合时态XML索引模型研究姓名:张遴申请学位级别:硕士专业:计算机应用技术指导教师:杨进才20070610中文摘要随着XML应用的普及,对XML文档查询的要求也就越来越高.如果不在XML文档上建立索引结构,那么针对XML数据的任何查询都很可能导致对整个文档树的遍历.对于海量的XML文档这种遍历所花费的开销巨大.因此,建立高效的索引用来查询XML文档成为近来研究的热点.在已有的索引结构中,ViST是一种功能强大的索引.然而,当查询一个XML路径是否存在于XML文档中时,其效率十分低下,并且其搜索结果也可能与XML原文档不符。本文

2、提出了新的索引结构:一种结构编码与簇集索引相结合的XML混合索引(简称HiSC).XML文档中的每条路径被编成结构编码序列,这些序列与XML树中结点序列一一对应,并将XML树中结点分类保存.查询时,对查询路径进行结构编码,然后将这些编码与XML文档的结构编码进行匹配,找出文档中所有可能的路径.此索引通过减少访趣不符合查询条件的数据来提高查询的效率,其查询结果更加精确且包含更多结构信息.同时,HiSC还支持关键字查询。通过在标准的XMARK样本数据集上实验,表明此索引结构在具有高的效率同时具有高的准确性.时态信息处理技术的应用领域越来越广阔,并有向多元化的

3、方向发展的趋势.由于时态信息数据的海量性以及时态信息存在方式的异构性,时态信息处理日益多样化和复杂化.因此,可以将Ⅺ讧L技术与现有一些时态技术相结合,从而有效处理时态信息.本文提出了·种支持时态Ⅺ咀度档的模型.此模型支持Ⅺ咀,文档保存事务时间和有效时间.通过对标准的Ⅺ沮。Sch瞰Ia进行扩充,使Ⅺ咀度档能够保存时变数据。为了更好地支持时态查询和更新,将时变数据分为历史数据和当前数据,采用不同的结构,分别存储。在此基础上提出了时态Ⅺ儿文档更新的方法。从理论上证明此模型同时满足时态一致性和路径一致性.关键词:簇集索引结构;结构编码;关键字查询;时态XML;时

4、态数据模型;AbstractAstheapplicationofXMLisusedmoreandmorewidely,therequirementofXMLqueryishigherandhigher.AnyqueryOilXMLdatamaycal.1∞thetraversingofthewholeXMLdocumenttree,ifthereisnoindexstructureinXMLdocument.Thecostofthistraversingmaybeinsupportableforlargedocument.Findingefficient

5、andusefulwaystosearchandindex∞mi-strueturedXMLdocumentsisapopularresearchtopic.Amongexistingindexes,ViSTisapowerfulindex.However,whenansweringaXMLpathwhetherexistsinXMLdocument,itsperformancedegradessignificantly.AndthesearchresultsmaybedifferentformthepartsofXMLdocument.Inthispa

6、per,weaddresstheproblemsbyputtingforwardanovelindexstructure,calledaHybridXMLIndexComposingStructure-EncodedWithCluster(HiSCforbrief).EverypathinXMLdocumentCanbetransformedinto童sequenceoflabelsbyStructure-Encodedthatconstructsaone-to-onecorrespondencebetweenXMLtreeandsequence.Bas

7、e011identifyingcharaeteristiesofnodesinXMLtree,theelementsa阳classifiedandclustered.Duringqueryproceeding,thetwigpatternisalsotransformedintoitsStructuro-Encoded.ByperformingsubsequencematchingonthesetofsequencesinXMLdocuments,alltheoccurren淄ofpathintheXMLdocumentsarerefined.Using

8、theindex,thequeryefficacyisquickenbyredu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。