企业环境中高性能数据仓库dw2.0架构的设计与实现

企业环境中高性能数据仓库dw2.0架构的设计与实现

ID:33931070

大小:1.80 MB

页数:85页

时间:2019-02-28

企业环境中高性能数据仓库dw2.0架构的设计与实现_第1页
企业环境中高性能数据仓库dw2.0架构的设计与实现_第2页
企业环境中高性能数据仓库dw2.0架构的设计与实现_第3页
企业环境中高性能数据仓库dw2.0架构的设计与实现_第4页
企业环境中高性能数据仓库dw2.0架构的设计与实现_第5页
资源描述:

《企业环境中高性能数据仓库dw2.0架构的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、企业环境中高性能数据仓库DW2.0架构的设计与实现ADissertationSubmittedtoShanghaiJiaoTongUniversityforMasterDegreeofEngineeringDESIGNANDIMPLEMENTATIONOFHIGH-PERFORMANCEDATAWAREHOUSEDW2.0ARCHITECTUREINENTERPRISEENVIRONMENTUniversityCode:10248Author:YuYangStudentID:1090379148M

2、entor1:ShenYaoMentor2:LiuBaoLiangField:SoftwareEngineeringDateofOralDefense:SchoolofSoftwareShanghaiJiaotongUniversityOct,2012企业环境中高性能数据仓库DW2.0架构的设计与实现上海交通大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。

3、对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日企业环境中高性能数据仓库DW2.0架构的设计与实现上海交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年

4、解密后适用本授权书。本学位论文属于不保密□。(请在以上方框内打“√”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日企业环境中高性能数据仓库DW2.0架构的设计与实现企业环境中高性能数据仓库DW2.0架构的设计与实现摘要在企业中,经过若干年信息化工作后,企业中保留了大量历史数据。在第一代数据仓库建立后,企业已经可以利用存在的历史数据来做事务性数据的分析工作。但随着数据生产成本的不断降低,人类生产数据的数量正在飞速增加,整个社会正处在数字大爆炸的时代,从而使企业的生存环境发生了巨大的变化。

5、对于企业而言,如何去适应这种变化已经变为能否在行业中保持领先的决定性因素之一。第一代数据仓库已显现出非结构化数据处理、容量、经济性等问题,不能再满足企业对数据存储与分析的需求。本文的主要目的是在第一代数据仓库的基础上,通过引进第二代数据仓库(DW2.0)架构,并结合当前流行的并行处理计算技术,来实现第二代数据仓库的应用。论文介绍了实现第二代数据仓库的技术背景,设计了数据仓库平台的总体架构,详细描述了数据仓库平台中各个组成部件并进行了总体设计,实现了第二代数据仓库中的三个关键技术。它们分别是:1)并

6、行数据处理技术实现,包括硬件组成与数据库软件的使用,并行数据处理的实现使企业能在成本有限增加的前提下,实现对大数据量和高性能存储与分析的需求;2)对非结构化数据存储与分析的技术实现,使企业能够对占企业数据量60%的非结构化或半结构化数据进行分析,帮助企业利用所有企业中的数据并获取价值;3)根据数据仓库中数据的使用概率和访问模式,将数据分为交互区、整合区、近线区与归档区四个区域进行数据生命周期管理,用以提高数据仓库的性能。论文将以实例的方式来说明第二代数据仓库将如何有效支持企业战略决策工具BSC(平

7、衡计分卡)系统的运行。BSC系统是帮助企业化战略为行动的管理体系。BSC项目的主要作用是将企业的战略目标划分为财务、客户、内部流程、学习与成长四个基本方面,由BSC战略地图将以上四个基本目标划分为互为因果的具体指标,通过对指标的高质量执行与评估来提高企业的管理水平。第二代数据仓库的实施将为BSC系统提供全面的数据支持,这些数据不仅包括来自企业ERP系统的结构化数据也包括企业在运行过程中产生的非结构化数据。将结构化数据与非结构化数据进行综合分析后,可以揭示出企业在运行管理过程中被忽略的重要信息,帮助

8、企业获得更加精确有效的BSC指标评分,有利于企业不断改进企业流程与管理方法,从而提升企业的核心竞争力。I企业环境中高性能数据仓库DW2.0架构的设计与实现关键词:DW2,非结构化数据,大规模并行处理,数据生命周期,BSCII企业环境中高性能数据仓库DW2.0架构的设计与实现DESIGNANDIMPLEMENTATIONOFHIGH-PERFORMANCEDATAWAREHOUSEDW2.0ARCHITECTUREINENTERPRISEENVIRONMENTABSTRACTByye

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。