ETL_data warehouse etl tookit.pdf

ETL_data warehouse etl tookit.pdf

ID:34747885

大小:4.20 MB

页数:308页

时间:2019-03-10

ETL_data warehouse etl tookit.pdf_第1页
ETL_data warehouse etl tookit.pdf_第2页
ETL_data warehouse etl tookit.pdf_第3页
ETL_data warehouse etl tookit.pdf_第4页
ETL_data warehouse etl tookit.pdf_第5页
资源描述:

《ETL_data warehouse etl tookit.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、目录第一部分需求、现状和架构第一章一切从需求出发第二章ETL数据结构第二部分数据流第三章抽取第四章清洗和规范化第五章提交维度表第六章提交事实表第七章开发程序第三部分开发和运行维护第八章运行维护第九章元数据第十章职责与分工第四部分实时流ETL系统第十一章实时ETL系统第十二章结论ModifiedbyEagleWang2008-5-30Chengtu致谢首先我们要感谢阅读了数据仓库工具箱丛书的成千上万的读者,感谢你们对于撰写这本数据仓库ETL书籍的大力支持和鼓励。我们确信还会不断地从你们——数据仓库的使用者和开发者——那里学习到更多的东西。非常感谢JimStagnitto,是他鼓励

2、Joe开始此书,并给了他足够的信心完成该项目。Jim是事实上的第三作者,他在数据质量和实时ETL的章节中作出了主要的创造性贡献。另外还要感谢JeffCoster和KimM.Knyal,他们在前/后加载处理和ETL项目管理的讨论中做出了特殊的贡献。我们有一个特别的读者小组,他们仔细阅读了本书手稿的第一版本,并给出了大量有用的建议。一般来说,对于已经“完成”的手稿再做修改是非常令人头疼的事,但是这种深层次的校读对于工具箱系列的书籍来说是一种传统,这次也不例外,并且非常成功。以字母顺序,这些读者包括:WouletaAyele,BobBecker,Jan-Willem,Beldman,

3、IvanChong,MauriceFrank,MarkHodson,PaulHoffman,QiJin,DavidLyle,MichaelMartin,JoyMundy,RostislavPortnoy,MalathiVellanki,PadminiRamanujan,MargyRoss,JackSerra-Lima,以及WarrenThornthwaite。我们还特别感谢RobinCaserta(Joe的妻子)和JulieKimball(Ralph的妻子)在整个项目期间给予的支持,还有孩子们ToriCaserta,BrianKimball,Sara(Kimball)Smith

4、以及孙子AbigailSmith(!),他们对于作者总是处于工作状态给予了充分的理解和耐心。最后,Wiley计算机图书小组又一次成为了本书完成的主要原因。感谢你们,BobElliott,KevinKent和AdaobiObiTulton。作者简介RalphKimball博士,Kimball集团的创始人,从1982年起就成为数据仓库领域的领导者,也是当今最著名的演说家、咨询专家、教师和作家之一。他的书籍包括<<数据仓库工具箱>>(Wiley,1996)、<<数据仓库生命周期工具箱>>(Wiley,1998)、<>(Wiley,2000)和<<数据

5、仓库工具箱第二版>>(Wiley,2002)。他自1995年以来一直为<<智能企业>>杂志撰写专栏文章,并获得了1999年度“读者最爱奖”。Ralph在斯坦福大学获得了电子工程学博士学位,论文题目是人-机系统设计。他从1972年到1982年在XeroxPARC和XeroxSystem的开发部门任研究员、系统开发经理和产品市场经理。由于他在XeroxStar工作站(第一个视窗、图标和鼠标的商业产品)的系统设计工作,IEEEHumanFactorsSociety授予他AlexanderC.Williams奖。从1982年开始到1986年,Ralph是Metaphor计算机系统公司(

6、第一家数据仓库公司)的应用部副总裁。在Metaphor,Ralph发明了“胶囊”工具,这是图形化数据流界面的第一个商业实现,现在已经应用在所有ETL工具中。从1986年到1992年,Ralph成为RedBrick系统公司的创始人和CEO,该公司提供一种非常快速的关系型数据库技术来实现决策支持。1992年,Ralph创办了RalphKimball协会,在2004年这个协会演变成为Kimball集团。Kimball集团是一个高度专业化的数据仓库设计专家团体,这些专家因其在咨询、教育、演讲和著作方面的成就而享有较高的声誉。JoeCaserta是CasertaConcepts,LLC的

7、创始人和负责人。他是非常有影响力的数据仓库专家,其专业技能来自于主流数据仓库工具和数据库的行业经验和实践应用。Joe就读于纽约哥伦比亚大学的数据库应用开发和设计专业。介绍抽取-转换-加载(Extract-Transform-Load)系统是数据仓库的基础。一个设计良好的ETL系统从源系统抽取数据,执行数据质量和一致性标准,然后规格化数据,从而使分散的源数据可以集中在一起使用,最终再以可以展现的格式提交数据,以便应用开发者可以创建应用系统,也使最终用户可以制定决策。该书围绕这四个步骤进行组织。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。