欢迎来到天天文库
浏览记录
ID:54127601
大小:201.57 KB
页数:6页
时间:2020-04-29
《数据仓库中实视图聚集函数的增量更新.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第32卷第1期东南大学学报(自然科学版)Voi.32No.12002年1月JOURNALOFSOUTHEASTUNIVERSITY(NaturaiScienceEdition)Jan.2002!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!数据仓库中实视图聚集函数的增量更新1112胡孔法宋爱波董逸生赵庆建(1东南大学计算机科学与工程系,南京210096)(2河海大学信息管理系,常州213022)摘要:提出在视图表达式树中以由下到上的方式计算中间结点的变化,将计
2、算出的中间结果作为辅助视图保存在数据仓库中,利用这些辅助视图或子视图计算出来的聚集函数的变化,来计算本视图聚集函数值的更新,实现视图的增量维护,从而缩短数据仓库更新维护时间,提高OLAP查询效率.同时,介绍了实视图中聚集函数的增量更新算法,实现实视图聚集函数的更新维护.关键词:数据仓库;联机分析处理;聚集函数;增量更新算法中图分类号:TP311文献标识码:A文章编号:1001-050(52002)01-0011-04IncrementalupdatesofaggregatefunctionsofmaterializedViewint
3、hedatawarehouse1112HuKongfaSongAiboDongYishengZhaoOingjian(1DepartmentofComputerScienceandEngineering,SoutheastUniversity,Nanjing210096,China)(2DepartmentofInformationManagement,HohaiUniversity,Changzhou213022,China)Abstract:Thispaperproposesamethodtocomputethechangeso
4、feachintermediatenodeinabottom-upfashionintheviewexpressiontreeandstorethedataasauxiiiaryviewinthedatawarehouse.Bycom-putingtheupdatesoftheaggregatefunctionswiththeseauxiiiaryvieworchiidview,wecancomputetheupdatestotheaggregatefunctionoftheviewandimpiementtheviewincrem
5、entaimaintenance.ThusthemaintainabietimeofupdatingthedatawarehousecanbereducedandtheefficiencyoftheOLAPgueriesimproved.Theauthorsaisoproposeamaintainabieandincrementaiupdateaigorithmtomakeaggregatefunctionsonmateriaiizedviewsmaintained.Keywords:datawarehouse;on-iineana
6、iyticaiprocessing;aggregatefunctions;incrementaiupdatesaigorithm[1]联机分析处理(on-iineanaiyticaiprocessing,OLAP中的一个关键问题.OLAP)涉及从大量源数据提取的总结数据,一般以数据更新一般采用从头重新生成和增量维护实视图方式在数据仓库中存储,随着源数据的更两种方法,重新生成需要更新的总结数据很费时,新,这些实视图也要作相应的更新.由于数据仓库一般采用增量维护方法.所谓增量维护就是根据源(datawarebhouse,DW)中的实视图
7、很多,且数据更数据的改变和聚集函数的旧值,推算出聚集函数的新会影响OLAP对用户的服务,每天可用于维护的新值.源数据的变化可以随时由数据源传送至数据时间是有限的.因此,提高对实视图的维护效率是仓库,并分别作为插入数据和删除数据保存在数据仓库中.通过这些源数据的变化,可以预先计算出收稿日期:2001-05-28.事实表和各个实视图的增量(或变化).源数据变化基金项目:江苏省“九五”重点攻关课题资助项目(BG980171).的传送和OLAP中数据增量的预先计算不影响事作者简介:胡孔法(1970—),男,博士生;董逸生(联系人),男,教授
8、,博士生导师.实表和实视图,因而可在数据仓库服务的同时进2东南大学学报(自然科学版)第32卷行,以缩短因维护而中止数据仓库服务的时间.d是子孙结点深度最大值加l.优化表达式树的高保持视图随着源数据的变化而更新的过程称度h是树中所有结点
此文档下载收益归作者所有