欢迎来到天天文库
浏览记录
ID:5203875
大小:2.94 MB
页数:56页
时间:2017-12-06
《基于etl应用的商业决策信息系统的设计与实现硕士学位论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、2015年度专业硕士学位论文学校代码:10269学号:63131500220基于ETL应用的商业决策信息系统的设计与实现院系:软件学院类别:工程硕士领域:软件工程指导教师:蒲戈光教授申请人:罗贤杰I2010ProfessionalMaster’sDegreeThesisUniversityCode:10269StudentID:63131500220EastChinaNormalUniversityBasedontheETLapplicationinformationsystemdesignandimplementationofbusi
2、nessdecisionsDepartment:SoftwareEngineeringInstituteType:MasterofEngineeringDomain:SoftwareEngineeringSupervisor:PuGeguangprofessorApplicant:LuoXianjieI华东师范大学学位论文原创性声明郑重声明:本人呈交的学位论文《基于ETL应用的商业决策信息系统的设计与实现》,是在华东师范大学攻读硕士/博士(请勾选)学位期间,在导师的指导下进行的研究工作及取得的研究成果。除文中已经注明引用的内容外,本论文
3、不包含其他个人已经发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢意。作者签名:日期:年月日华东师范大学学位论文著作权使用声明《基于ETL应用的商业决策信息系统的设计与实现》系本人在华东师范大学攻读学位期间在导师指导下完成的硕士/博士(请勾选)学位论文,本论文的研究成果归华东师范大学所有。本人同意华东师范大学根据相关规定保留和使用此学位论文,并向主管部门和相关机构如国家图书馆、中信所和“知网”送交学位论文的印刷版和电子版;允许学位论文进入华东师范大学图书馆及数据库被查阅、借阅;同意学校将学位论
4、文加入全国博士、硕士学位论文共建单位数据库进行检索,将学位论文的标题和摘要汇编出版,采用影印、缩印或者其它方式合理复制学位论文。本学位论文属于(请勾选)()1.经华东师范大学相关部门审查核定的“内部”或“涉密”学位论文*,于年月日解密,解密后适用上述授权。()2.不保密,适用上述授权。导师签名本人签名年月日*“涉密”学位论文应是已经华东师范大学学位评定委员会办公室或保密委员会审定过的学位论文(需附获批的《华东师范大学研究生申请学位论文“涉密”审批表》方为有效),未经上述部门审定的学位论文均为公开学位论文。此声明栏不填写的,默认为公开学位
5、论文,均适用上述授权)。I摘要随着信息管理系统的应用的增多,企业的业务系统中产生了越来越多的数据孤岛。怎样把数据孤岛利用起来,于是就产生了ETL概念。ETL指的是数据抽取、数据转换和数据加载,他们在构建数据仓库过程中占到了极其重要的地位。在如今社会中,信息在企业中的地位日趋重要,是企业进行科学的管理以及决策分析的基础。目前,大部门企业在构建业务系统和办公自动化系统中花费了大量的时间和资金,用来记录业务处理的各类数据。在普遍情况中,企业的数据量每2年左右就会翻倍增长,数据中隐藏着大量的商业价值,但是往往企业所能运用的仅仅只占总量的4%左右
6、。企业并没有将这些数据资源加以最大化地利用,从而浪费了更多的资金以及时间,更在制定商业决策时候失去了先机。于是,企业如何运用技术手段,将这些业务数据更好加以利用,已成为提高企业竞争力的瓶颈。本文以国内某企业为研究背景,根据公司决策层的需求,分析和设计了适合公司决策支持的数据仓库物理结构和逻辑模型,并对数据抽取、转换、装载(ETL)和数据清洗等技术进行了具体地应用实践,设计并实现了可满足决策分析所需的数据仓库及其相关的ETL工具。本论文的主要研究内容和成果概述如下:首先,在调研该企业的组织机构、业务系统和企业管理流程的基础上,分析和设计了
7、适合该公企业实际需要的数据仓库的五大模块,即财务模块、供应链模块、成本模块、生产制造模块和人力资源模块。采用星型和雪花模型结合的方式,设计了五大模块的逻辑和物理模型。根据企业具体情况,在操作数据存储(ODS)下创建了数据仓库。其次,设计了一个ETL工具以解决半结构化数据的抽取。运用DOM对象对数据源进行分析,从企业实际出发设计的ETL工具,能够将企业财务软件导出的XML格式数据加载到数据仓库中,也解决了商用的ETL工具无法对XML文档进行直接抽取、加载的弊端,解决了企业数据分析的实际困难。最后,设计了基于结构化数据的ETL工具。在该企业
8、实际运行的业务系统中,基于ORACLE和SQLSERVER的结构化数据占了大多数,基于结构化数据的ETLI工具,给用户开放了自行设计清洗函数接口,解决了商用ETL工具清洗函数的不可扩展问题。另外,并且在元数
此文档下载收益归作者所有