基于二次索引技术的xml查询研究

基于二次索引技术的xml查询研究

ID:33101377

大小:2.06 MB

页数:57页

时间:2019-02-20

基于二次索引技术的xml查询研究_第1页
基于二次索引技术的xml查询研究_第2页
基于二次索引技术的xml查询研究_第3页
基于二次索引技术的xml查询研究_第4页
基于二次索引技术的xml查询研究_第5页
资源描述:

《基于二次索引技术的xml查询研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国石油大学(华东)硕士学位论文基于二次索引技术的XML查询研究姓名:魏长芳申请学位级别:硕士专业:计算机科学与技术指导教师:魏东平20100501摘要XML作为新一代的数据交换标准,在网络上的应用越来越多,由此也产生了大量的XML数据。如何对XML数据进行有效的查询处理成为现在研究的热点。而XML作为半结构化数据具有自定义、可扩展等特性,这些特性对XML数据查询工作造成了一定的困难。索引作为加速查询处理的一种重要手段,在许多领域中都起着关键性的作用。因此,利用索引来提高数据的查询效率是一种可行的办法,本文在对国内外研究现状进行综合分析的

2、基础上,进一步对XML索引技术进行了深入的研究。论文对近年来提出的索引方法进行了学习研究,分析了现有索引的特点和优缺点,在此基础上提出了一种根据路径采用不同的索引结构进行查询的方法。该方法根据查询路径有简单路径和分支路径之分,分别采用压缩树索引和哈希编码索引进行处理。压缩树索引的方法对查询过程中的简单路径表达式进行处理。该方法不仅在组级提供了简洁的路径概要,而且在元素级提供了父子关系的详细连接信息。当元素级映射可以快速的访问一个元素的父节点时,组级可以有效地减少搜索空间。该索引使用基于组的元素引用替换了对元素进行编码,减小了索引所需的空间

3、。同时,引入改进的正排索引和倒排索引加快对元素的判断,更高效的获得索引组中的信息。基于组级的元素作为参考,不仅可以使压缩树根据组聚类成倒排表从而为倒排表和组范围(组一级)的结构索引提供更好的连接,还可以根据组级的元素信息很容易的对不同类型的XML数据进行分类,将相近的元素放在一起以便于索引。基于压缩树的查询处理方法能加速查询分析,并在处理的早期极大地减少搜索空间。哈希编码索引的主要思想是XML文档中的每一个节点对应索引树中的一个节点,索引树中的非叶子节点存放着该节点在XML文档中的位置,索引树的边存储的是XML文档中父节点到其子节点的路径

4、哈希码。索引树中的叶子节点存放着XML节点的数据。哈希编码路径索引树具有比较好的扩展性,该索引通过存储节点的哈希编码来代替以前索引中存储节点的字符串的方法,从而减少了索引文件所需的存储空间。通过对文档树中节点进行编码,将字符串装换为整数,提高查询速度。该索引引进传统数据库中层次索引的概念,实现了对频繁使用路径的直接存取。本文提出了一种层次索引的方法,根据路径表达式的具体情况以及表达式使用的频率不同而采用不同的索引方式,通过多级索引提高检索的效率。关键词:XML数据树;压缩树;哈希编码;层次索引ResearchonSecondeIndexT

5、echnologyforXMLDataWeiChangfang(ComputerScienceandTechnology)DirectedbyAssociate—ProfessorWeiDongpingAbstractXMLasthenewgeneration’Sdataexchangestandard,aregettingmoreandmoreuseinthenetworkapplication.TherearethemassiveXMLdata.HowtocarryontheeffecitiveinquirytotheXMLdatat

6、oprocessthehotspotwhichintothepresentstudies,However,XMLdataisasemi—stucturizeddata.Ithasthecharacteristicsofdefinitionandexpand.ThesecharacteristicshavecausedcertaindifficultytotheXMLdataquerywork.Theindexachievementacceleratestoinquiretheprocessingallimportantmeansthati

7、splayingthecrucialroleinmanydomains.Therefore,enhancethedatausingtheindexisanfeasiblemeans.Thisarticleincarriesonthegeneralizedanalysistothedomesticandforeignresearchpresentsituationinthefoundation,hasfurtherconductedthethoroughresearchtotheXMLindextechnology.Papertheinde

8、xmethodwhichproposedtotherecentyearshasconductedthestudyresearch,hasanalyzedtheexistingindexchar

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。