欢迎来到天天文库
浏览记录
ID:45745698
大小:81.26 KB
页数:7页
时间:2019-11-17
《_数据仓库多维数据视图动态物化策略》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、DSSMV----多维数据物化视图的动态选择策略(dafcihuang@163・com)摘要提出了多维数据中物化视图的动态选择策略一-DSSMV,其中包括候选视图选择算法CVSA、改进的BPUS算法一-TGA算法、物化视图集调整算法MAVM和物化视图的动态调整算法DMAVMC该策略削减算法的搜索空间,降低算法的复杂度,同时通过改进BPUS算法,并增加调整算法从而提高了物化视图集对查询的响应性能,该策略还通过定时地判断查询视图类型分布是否变化来决定是否进行物化视图的动态调整,从而避免了物化视图集“抖动”的
2、发牛。通过分析和实验对比可以看到,该算法通过定时地执行可以显著降低管理员的工作的复杂度,保持物化视图集具有较好的响应性能。关键词物化视图;OLAP;动态选择;多维数据;数据仓库DynamicSelectionStrategyofMaterializedViewsofMulti-DimensionalDataHuangZongyi,XueYongsheng,WengWei,WenJuan,CaiJin(DepartmentofComputerScience,XiamenUniversity,Xiamen3
3、61005,China)AbstractThispaperpresentsDSSMV(DynamicSelectionStrategyofMaterializedViews),anapproachcomposedoffouralgorithms:CVSA(CandidateViewsSelectionAlgorithm)JGA(TheImprovedGreedyAlgorithm),MAVM(ModulationAlgorithmofViewMaterialization),DMAVM(DynamicM
4、odulationAlgorithmofViewMaterialization).CVSAisinchargeofproducingcandidateviewset,whichisproventobesufficientandnecessaryforselectingthebestsetofmaterializedviews.IGAandMAVMarebasedontheGreedyAlgorithm.DMAVMusedthesamplespacetojudgewhetheritisnecessaryt
5、ochangetheviewsetandrestrainthenumberofviewsatverylowcost.ThecomparativeexperimentindicatesthatDSSMVcanbeemployedbythestaticalgorithmstoreduceeffectivelytheamountofviewsbeforehand,andthecostofstaticalgorithmsonspaceandtimecanbecutdowntofitforonlinedemand
6、・Keywordsmaterializedview;OLAP(OnlineAnalyticalProcessing);dynamicselection;multi-dimensionaldata;datawarehousing1引言从某种角度看,数据仓库是一组视图的集合。这些视图是从数据库或基库中分组聚集而成的,其中在物理意义上实际存在的视图称为实视图;而物理上不存在,当需要时从其他视图或基库中导出的视图称为虚视图。所谓视图的物化就是指以表的存储形式将虚视图转化为实视图。视图的物化策略对数据仓库的杏询响
7、M时间有重要影响。到目前为止,己存在许多物化视图的选择算法,这些算法通过不同的途径实现对物化视图的选择提高系统的整体效率。但总的來说都没冇取得理想的效果。可以说,对多维数据物化视图选择仍然是一个有待于更深入研究的问题。2相关工作斯坦福大学的Harinarayan在文献[1]屮首先提出数据立方体的格模型,以此來描述视图间的相互依赖关系并给出了简单的BPUS算法来解决视图的选择问题。这一算法的效來和最优解的比值不小于l-1/e,在此基础上,文献⑵讨论了带有B-树索引的物化视图的选择问题;文献[3]提出了以物
8、化视图的尺寸为选择标准,其算法时间复杂度为0(nlgn)的选择算法PBS;文献[4]提出了一系列启发式视图选择的算法框架;而文献[5,6]将遗传算法获取最优解的能力用于最优物化集的选择,并在降低算法复杂度方面进行了硏究。本课题得到福建省自然基金资助(A0310008)和福建省高新技术研究开放计划重点项II资助(2003H043)。黄宗毅硕士,主要研究方向为数据仓库.数据挖掘.分布式数据库等。薛永生教授,主耍演就方向为数据仓库理论与应用.分布
此文档下载收益归作者所有