xml簇聚存储及路径选择性代价估计研究

xml簇聚存储及路径选择性代价估计研究

ID:33405533

大小:2.95 MB

页数:65页

时间:2019-02-25

xml簇聚存储及路径选择性代价估计研究_第1页
xml簇聚存储及路径选择性代价估计研究_第2页
xml簇聚存储及路径选择性代价估计研究_第3页
xml簇聚存储及路径选择性代价估计研究_第4页
xml簇聚存储及路径选择性代价估计研究_第5页
资源描述:

《xml簇聚存储及路径选择性代价估计研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中南大学硕士学位论文XML簇聚存储及路径选择性代价估计研究姓名:李建军申请学位级别:硕士专业:计算机软件与理论指导教师:杨路明20080501摘要随着互连网的快速发展,出现了大量的Web数据,这些Web数据多以XML文档形式出现,如何有效存储XML文档和从大量XML文档中检索有用信息,已成为数据库研究领域的一个重要研究课题。本文的研究工作主要围绕XML数据存储和查询优化展开,重点研究XML簇聚存储模型和路径选择性代价估计。首先对XML技术做了综述,分析了Ⅺ儿的研究现状和技术上的突破,然后重点从XML簇聚存储和查询优化两个方面做了深入的研究工作。在Ⅺ订

2、L簇聚存储方面,针对DOM(文档对象模型)不能有效减少XML查询的磁盘I/O问题,提出了X.cluster簇聚存储模型,此模型根据结点划分思想将XML文档中结点结构与结点值最为“相似"的一组结点簇聚在一起,并为不同的结点值类型引入了不同的存储模型和压缩方法,解决了以往簇聚模型中人为地割裂结点结构与结点值之间的关系,簇聚误差过大的问题;在XML查询优化方面,深入研究了XML路径选择性代价估计,详细分析了基于直方图的路径选择性代价估计(Ⅲ'M)方法,针对HPM方法计算效率低,选择性估计精度不高的缺点,将X-cluster簇聚大纲统计信息模型引入路径选择性

3、代价估计中,提出了CHPM方法。该方法通过计算选择率为百分之百的结点或路径跳过不必参与直方图运算的结点或路径,减少了代价树的规模,从而提高路径选择性代价估计的效率;同时为了避免中间结果直方图某些格中的高频数据对后续直方图运算精度的影响,给出了直方图的压缩策略,通过压缩使直方图中的数据近似满足均匀分布,从而降低路径选择性估计的误差。实验表明,X.cluster簇聚大纲及基于此大纲和压缩直方图技术的XML含值谓词路径选择性代价估计方法无论是针对单谓词简单路径选择性代价估计还是多谓词复杂路径选择性代价估计,代价估计的相对误差都较低,是一种可行而有效的方法。

4、关键词XML数据库,XML簇聚,代价估计,直方图,稳定性ABSTRACTWiththerapiddevelopmentofintemet.alotofWrebdataappears.TheyarealmostrepresentedbvXMLdocument.HowtostorageXMLdocumentandretrieveusefulinformationfromalotofXMLdocumentbecomesallimportanthotspotinthefieldofdatabasestudy.ThisPaperresearchesonthes

5、torageofXMLandqueryoptimizationandfocusonXMLclusterstoragemodelandselectivityestimationofpathexpression.ThispaperbeginswiththesummaryofXMLtechnique,analyzestheircurrentstatusandthebreakthroughoftheirtechnique,anddoesthestudyinthefieldsofXMLclusterstorageandqueryoptimization.Int

6、hefieldofXMLclusterstorage,facingtheproblemthatDOM(documentobjectmodel)CannotreducethediskI/OtimesefficientlyintheprocessofXMLquery,thispaperproposesX—clusterstoragemodelwhichaggregatesthemostsimilarnodesinthefieldofnode’Sstructureandnode’Svaluesaccordingtotheconceptofnodesdivi

7、sion,providesthedifferentstoragemodelsandmethodsfordifferentnodevaluetypes,solvestheproblemthatseparatingnode’Sstructureandnode’Svalueinthepreviousclustermodelobjectivelyandprettymuchinaccuracyofclusteraswell.Inthefieldofqueryoptimization,thispaperstudystheselectivityestimation

8、ofpathexpression,analysesthemethodofselectivityestimat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。