datastage企业版产品白皮书之四

datastage企业版产品白皮书之四

ID:18968162

大小:363.50 KB

页数:15页

时间:2018-09-27

datastage企业版产品白皮书之四_第1页
datastage企业版产品白皮书之四_第2页
datastage企业版产品白皮书之四_第3页
datastage企业版产品白皮书之四_第4页
datastage企业版产品白皮书之四_第5页
资源描述:

《datastage企业版产品白皮书之四》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、中国建设银行统一数据交换池项目-产品白皮书统一数据交换池项目ETL工具软件及产品现场支持服务竞争性谈判提交文件之六.二.四ProfileStage白皮书之一北京先进数通信息技术有限公司2004年10月21日本文件涉及信息为北京先进数通信息技术有限公司专有信息,敬请视同机密文件处理。除因需要而得到授权的中国建设银行及本公司有关人员外,请勿以任何形式向他人或任何第三方透露。第15页中国建设银行统一数据交换池项目-产品白皮书目录1.Ascential企业数据综合优势32.元数据的重要性43.手工处理的危险54.AscentialProfileStage优势

2、75.列分析96.表分析107.交叉表分析118.标准化119.转换映射编辑1210.对ETL工具的支持1211.AscentialProfileStage是任何数据综合项目的必要条件1212.关于Ascential软件14第15页中国建设银行统一数据交换池项目-产品白皮书1.Ascential企业数据综合优势在任何电子商务中心,用户关系管理(CRM),企业资源计划(ERP),供应链管理(SCM),商业智能(BI),数据仓库或数据集市项目是数据综合的必要条件。软件供应商已经销售的多种产品使企业能够完成数据综合项目。但是,一直没有单一供应商为端对端的企

3、业数据综合项目提供功能完善的产品。用户必须依赖供应商拼凑的产品,满足他们在数据概括,ETL,数据质量和元数据管理上的技术需要。现在用AscentialProfileStage工具,Ascential软件提供一个源自单个供应商的,功能完善的,具有易建立的、自动的、易使用的端对端的企业数据管理技术。AscentialProfileStage是Ascential的数据概括软件,它使分析源数据和建立企业数据管理系统的过程自动化、简单化。AscentialProfileStage使用复杂的逆向工程处理,允许用户把原始数据装进软件,并且自动接收源数据的完整分析。

4、AscentialProfileStage软件逆转来自原始数据的工程师元数据。AscentialProfileStage分析源数据、为目标数据库提出建议,例如主关键字,外关键字,表分裂,标准化,并观察数据。然后,AscentialProfileStage使用这些信息建造数据模型并且优化目标数据库定义。AscentialProfileStage靠全面理解元数据并且产生一个AscentialDataStageETL处理合并数据,允许用户集成多个不同的系统。因为代码自动生成,实施速度戏剧性加快。由于元数据基于实际源数据,准确性是100%,避免了编码、装载、

5、爆炸的现象。因此避免了通常数据综合项目遇到的那些问题。元数据寻求从周围企业组合数据的所有信息技术项目都挣扎在同样的岩石上:元数据。元数据是技术术语,是用来描述数据怎样被使用和捕获的学问。元数据是数据的结构,即所用域的类型,哪些域是关键字,域的长度,数据之间的相互关系,和数据的其他信息。例如,在顾客服务部门的顾客电话(工作电话)第15页中国建设银行统一数据交换池项目-产品白皮书和在运送部门的顾客电话(家庭电话)的元数据也许是不同的。由于AscentialProfileStage,项目能自动避免在数据库里存有错误的电话号码的问题。1.元数据的重要性分析家

6、研究显示超过百分之75%的数据综合项目不是超出预算的限制就是彻底失败。这些项目或者不能提供必需的特性,超出预算,或者在完成之前被取消。为什么这么高的失败率?在很大程度上,传统的数据综合方法采取下列步骤:1)分析用户的需求并且建立目标数据库说明书:在访问用户之后,为数据库模型设计主要方案,该方案将回答所有的、用户想要的目标应用要回答的问题。2)分析可利用的数据源:一套来自旧系统、操作系统、等等的数据,为了目标数据库,而被编辑分析,以确定他们的关联性。可能得不到数据源的文档,或者可能文档是不正确的。依据一系列涉及源数据的样品来识别数据的特性。3)建立一套

7、源数据到目标数据库的映射:设计一个把各种各样的数据源转换成目标的计划。通常,用ETL工具或手编码程序来完成这步。4)准备数据:源数据被装载到集结地区,被整理、清洁,并转换为目标数据存储所需的形式。为规范数据和连接纪录,数据质量软件可以部署在这个阶段。5)装载数据:数据从这个集结地区移进目标应用区域。这步包括要报告的格式化数据。这手工方法的主要弱点在于它做了个假定,应用所必需的数据实际上可以从数据源中获得。很多公司在数据综合项目上已经花费了数百万美元,仅仅发现源数据不支持他们已经为目标数据库建立的模型。由于整个过程由一系列杂乱无章的、通常由程序员独立小

8、组手工完成的步骤组成,而每步之间的不连续性经常导致灾难发生。公司通常在第3和第4步上花费他们的工程预算的80

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。