资源描述:
《olap系统中物化视图选择方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、复旦大学硕士学位论文OLAP系统中物化视图选择方法的研究姓名:严勇申请学位级别:硕士专业:计算机软件与理论指导教师:丁宝康20040508摘要摘要OLAP(On-LineAnalyticalProcessing)技术是构建在数据仓库基础上的一项重要数据分析技术,它提供对数据的多维视图,即以多维的形式来观察各种历史数据,从而提供对决策的支持,是决策支持系统(DSS)的一个重要部分。而数据仓库是一个面向主题的、集成的、不可更新的且随时间不断变化的数据集合,用来支持管理人员的决策。作为OLAP系统的数据源,它维护着海量的数据,所支持的查询形式复杂,通
2、常需要访问大量数据,而与之矛盾的,OLAP系统却又要求对查询做出快速的响应。介了解决这对矛盾,人们往往将一部分多维视图进行物化,即预先计算好并直接存储下来,这样就可以有效地提高OLAP系统的查询效率。本文主要研究的正是物化方面的一个重要问题:即如何选择需要进行物化的视图集。在本文以前,为了解决这个问题,人们已经提出了一些方法,但无一例外的,这些方法的复杂度都非常地高,其中复杂度最小的PBS算法的时间复杂度是0(d2d),其中的d是多维数据集维的个数。在这样的复杂度下,无疑对于高维的多维数据集是不行的。本文为此作了进一步的研究,并提出了ANNE算
3、法框架,它的时间复杂度是O(dS'),其中由维的数目带来的影响降为线性,而S是一个受限的量。同时,在结果集的总体性能上,ANNE的性能几乎同原有的算法相同,并且在某些特殊情况下,本文成功地证明了甚至结果集也是完全一致的。以上的结论在实际的测试中均得到了很好的验证。作为国家863项目《基于Web服务的数据库新技术》的一部分,我们自行设计和开发了一个ROLAP系统,在该系统中成功地应用了ANNE算法框架来完成物化视图的选择。关键字:OLAP,数据仓库,视图,物化复旦大学硕士学位论文OLAP系统中物化视图选择方法的研究第1页AbstractOLAP(
4、On-LineAnalyticalProcessing)isaveryimportanttechniquebasedondatawarehouse.Itprovidesmulti-dimensionalviewsonthedatastoredinthedatawarehouse.Thatis,itobservesthehistoricaldatainamulti-dimensionalway.Thus,itisoneimportantpartoftheDecisionSupportSystem(DSS).Datawarehouseis,byde
5、finition,asubject-oriented,integrated,time-variantcollectionofdatatoenabledecisionmakingacrossadisparategroupofusers.AsthedatasourceofOLAPsystems,itmaintainshugeamountofdataandsupportscomplexqueriesonthedatawhichusuallyneedbrowsinglargeamountofdata.Onthecontrary,OLAPsystemus
6、uallyasksforquickresponsesinordersolvethiscontradiction,peoplematerializesomeoftheviewsbypre-computingthedataandstoringthemdirectly.Thisthesisputsitsfocusontheimportantproblem,thematerialization,whichishowtochoosethesetofviewstomaterialize.Beforethisthesis,peoplealreadyfound
7、somewaystosolvetheproblem,butunfortunately,requiringlargeamountoftime.Amongthem,thefastestisPBSwhosetimecomplexityis0(d2d)wheredisthenumberofdimensions.Inthisthesis,weproposedFrameworkANNEwhosecomplexityisO(dS')whereSislimited.Itsuccessfullyreducesthecomplexitytolinearwhilei
8、tspredecessorsrequireexponentiallyincreasingtimewiththenumberofdimensions.M