欢迎来到天天文库
浏览记录
ID:36569654
大小:3.70 MB
页数:55页
时间:2019-05-12
《基于SPRING框架的ETL工具的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、兰州大学硕士学位论文基于Spring框架的ETL工具的研究与实现姓名:张延堂申请学位级别:硕士专业:计算机应用指导教师:屈志毅20080501兰州大学硕士研究生学位论文基于Spring框架的ETLT具的研究与实现AbstractETL(Extraction—Transformation—Loading)isaprocessresponsiblefortheextractionofdatafromseveralsources,theirtransformation,cleansingandloadingintoatargetDataWarehousean
2、dwhichisacrucialstepinthebuildingofDataWarehouse.ThispaperresearchesthekeyproblemsrelatedtoETLprocessanddiscussestheimplementationofanengine-basedETLtool,JETLThetheorymodelofJETLisbasedonDWQ.ThecoredesignofJETLisanenginedrivenbyametadatarepository.Theimplementation’ofJETLisbased
3、OiltheSpringframeworkwhichiscompatibletothedesignpatternofJETL.ThekeyproblemsofETLprocess,suchasdatasourceintegration,drivingoftransformationengineandscheduleofworkflowareresolveduSingtheIoCmechanismofSpringThepersistentlayerofJETLrelayontheSpring'sDAOsupportThemetadatamanagemen
4、ttakesadvantageofthepowerandflexibilityofSpring'sXMLbeanconfigurationpattern.Inaddition,wepresenttheapplicationofJETLintheComprehensiveReportManagementandDecisionSupportSystemandproposeamethodologyinanengineeringprocessmanagementperspective.Intheend,wediscusstheimprovementsofJET
5、Lmdtheflll'therresearchproblems.KeyWords:DataWarehouse,ETL)metadata,SpringDAOII原创性声明本人郑重声明:本人所呈交的学位论文,是在导师的指导下独立进行研究所取得的成果。学位论文中凡引用他人已经发表或未发表的成果、数据、观点等,均已明确注明出处。除文中已经注明引用的内容外,不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究成果做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。论文作者签名:之幺丝日期:独星:苎:兰主关于学位论文使用授权
6、的声明本人在导师指导下所完成的论文及相关的职务作品,知识产权归属兰州大学。本人完全了解兰州大学有关保存、使用学位论文的规定,同意学校保存或向国家有关部门或机构送交论文的纸质版和电子版,允许论文被查阅和借阅;本人授权兰州大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用任何复制手段保存和汇编本学位论文。本人离校后发表、使用学位论文或与该论文直接相关的学术论文或成果时,第一署名单位仍然为兰州大学。保密论文在解密后应遵守此规定。论文作者签名:之丝缘师签名:El期:逊哆兰州大学硕上研究生学位论文基于Spring框架的ETL工具的研究与实现第1
7、章绪论1.1.数据仓库环境下的ETL过程数据仓库技术的目标是利用整合的来自组织内不同信息系统的数据信息,使得企业的决策者能更好更快的做出决策。数据仓库最常见的定义【11是:“数据仓库是一个面向主题的,整合的,随时间变化的,非易失数据的集合,用于支持企业的决策过程。它是商业智能数据整合的中心,也是传递企业数据一般视图的数据集市的数据源。”学界和商界在数据仓库方面做了很多的研究,特别是数据仓库的设计和基于数据仓库的决策支持等方面。数据仓库的典型结构【2】是,包含一个前端工具层:主要给访问数据仓库的最终用户提供决策支持工具;一个后端ETL工具层:用于把从多个
8、数据源提取的数据经过加工整合载入目标数据仓库。上述两层是数据处理层,前端层处理数据仓库中的数据
此文档下载收益归作者所有