欢迎来到天天文库
浏览记录
ID:34042621
大小:1.87 MB
页数:51页
时间:2019-03-03
《数据仓库中基于位图索引查询优化的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Athesis(dissertation)submittedtoZhengzhouUniversityforthedegreeofMaster18S72黾§TheResearchofQueryOptimizationBasedonBitmapIndicesforData"匀rehouseByxiaoChengSupervisor:Prof.yumeiChaiComputerSoftwareandTheorySchoolofInformationEngineeringMay2010/二原创性声明lIIll
2、lltl1111111IIIIIIIIIIIIY1833856本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。学位论文作者:手呈吨日期:刀fD年箩月弓fEl学位论文使用授权声明本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或
3、向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。学位论文作者:平呈司毛日期:加f。年罗月弓『日摘要索引是数据仓库查询优化的重要技术,主要包括树形索引和位图索引。其中位图索引因为其结构简单,并且硬件支持二进制位运算效率很高,被广泛应用
4、在数据仓库中。在属性的基数(该属性可能的取值数)低的情况下,位图索引已经被证明是十分高效的。但在基数比较高的情况下,位图索引需要占用大量的存储空间。位图索引往往被认为只有在属性基数较低情况下才适合使用。为了克服这个难题,现今研究者们已经提出了很多方法,包括编码,压缩,bin。其中bin位图索引可以有效的降低高基数时位图占用的空间。这种索引不像简单位图索引那样建立在每一个不同的属性值上,而是建立在一个个的属性范围上。但它同时也带来了另一个难题,就是候选检查。候选检查往往占用大部分的查询时间。采用传统多维查
5、询算法,对各属性进行查询的顺序不同,可能对总候选检查数目产生重大影响。本文给出两个定理,证明了影响排序的两个因素。并据此提出一种基于权值排序算法,通过在执行查询前对各属性查询进行排序,使总的候选检查的数目尽可能少。理论分析和实验表明,此排序算法可以明显减少总候选检查数目,优化了传统多维查询算法。但是排序的传统多维查询算法并不能减少查询的第一维所需的候选检查数目,实验表明第一维所需的候选检查数目往往占总候选检查数目的大部。通过预扫描(推迟候选检查)可以有效解决这个问题,但是进行预扫描需要额外的花费,即要扫
6、描更多的索引,这个代价是不能忽视的。考虑到预扫描一定维数后,继续预扫描将不会明显的减少总的候选检查数目,本文在排序的基础上提出动态预扫描算法,目标是在预扫描属性数目和总的候选检查数目中找出一个合理的平衡点,以提高查询效率。理论分析和实验结果表明,动态预扫描算法取得了良好的效果。关键字:数据仓库位图索引Binning编码压缩多维查询AbstractIndexisanimportantqueryoptimizationtechniquefordatawarehouse,whichincludingtreei
7、ndexesandbitmapindexes.Bitmapindexiswidelyusedinthedatawarehousebecauseofitssimplestructureanditshighefficiencyoflogicoperation.Bitmapindexhasproventobeveryefficientwinllowattributecardinalities(thenumberofdistinctvalues).However,forhigh-cardinalityattri
8、butes,bitmapindexrequirestoomuchstorage.Therefore,bitmapindexisoftenthinktobeunsuitableforhigh-cardinalityattributes.Researchershaveprovidedalotofstrategiestosolvethisproblem,includingcoding,compression,bin.Bitmapindex谢tll
此文档下载收益归作者所有