欢迎来到天天文库
浏览记录
ID:18745430
大小:176.00 KB
页数:7页
时间:2018-09-21
《dssmv----多维数据物化视图的动态选择策略》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、DSSMV----多维数据物化视图的动态选择策略黄宗毅薛永生翁伟文娟蔡劲(厦门大学计算机科学系福建厦门361005)(dafeihuang@163.com)摘要提出了多维数据中物化视图的动态选择策略---DSSMV,其中包括候选视图选择算法CVSA、改进的BPUS算法---IGA算法、物化视图集调整算法MAVM和物化视图的动态调整算法DMAVM。该策略削减算法的搜索空间,降低算法的复杂度,同时通过改进BPUS算法,并增加调整算法从而提高了物化视图集对查询的响应性能,该策略还通过定时地判断查询视图类型分布是否变化来决定是否
2、进行物化视图的动态调整,从而避免了物化视图集“抖动”的发生。通过分析和实验对比可以看到,该算法通过定时地执行可以显著降低管理员的工作的复杂度,保持物化视图集具有较好的响应性能。关键词物化视图;OLAP;动态选择;多维数据;数据仓库DynamicSelectionStrategyofMaterializedViewsofMulti-DimensionalDataHuangZongyi,XueYongsheng,WengWei,WenJuan,CaiJin(DepartmentofComputerScience,Xiamen
3、University,Xiamen361005,China)AbstractThispaperpresentsDSSMV(DynamicSelectionStrategyofMaterializedViews),anapproachcomposedoffouralgorithms:CVSA(CandidateViewsSelectionAlgorithm),IGA(TheImprovedGreedyAlgorithm),MAVM(ModulationAlgorithmofViewMaterialization),DMAV
4、M(DynamicModulationAlgorithmofViewMaterialization).CVSAisinchargeofproducingcandidateviewset,whichisproventobesufficientandnecessaryforselectingthebestsetofmaterializedviews.IGAandMAVMarebasedontheGreedyAlgorithm.DMAVMusedthesamplespacetojudgewhetheritisnecessary
5、tochangetheviewsetandrestrainthenumberofviewsatverylowcost.ThecomparativeexperimentindicatesthatDSSMVcanbeemployedbythestaticalgorithmstoreduceeffectivelytheamountofviewsbeforehand,andthecostofstaticalgorithmsonspaceandtimecanbecutdowntofitforonlinedemand.Keyword
6、smaterializedview;OLAP(OnlineAnalyticalProcessing);dynamicselection;multi-dimensionaldata;datawarehousing1引言从某种角度看,数据仓库是一组视图的集合。这些视图是从数据库或基库中分组聚集而成的,其中在物理意义上实际存在的视图称为实视图;而物理上不存在,当需要时从其他视图或基库中导出的视图称为虚视图。所谓视图的物化就是指以表的存储形式将虚视图转化为实视图。视图的物化策略对数据仓库的查询响应时间有重要影响。到目前为止,已存
7、在许多物化视图的选择算法,这些算法通过不同的途径实现对物化视图的选择提高系统的整体效率。但总的来说都没有取得理想的效果。可以说,对多维数据物化视图选择仍然是一个有待于更深入研究的问题。2相关工作斯坦福大学的Harinarayan在文献[1]中首先提出数据立方体的格模型,以此来描述视图间的相互依赖关系并给出了简单的BPUS算法来解决视图的选择问题。这一算法的效果和最优解的比值不小于1-1/e,在此基础上,文献[2]讨论了带有B-树索引的物化视图的选择问题;文献[3]提出了以物化视图的尺寸为选择标准,其算法时间复杂度为O(n
8、lgn)的选择算法PBS;文献[4]提出了一系列启发式视图选择的算法框架;而文献[5,6]将遗传算法获取最优解的能力用于最优物化集的选择,并在降低算法复杂度方面进行了研究。这些方案均基于查询的分布情况是已知的。由于OLAP系统中的查询是随机的,选择物化视图不可能确知系统中的查询集合,因而现有OLAP系统中物化视图的选
此文档下载收益归作者所有