数据集成解决方案探讨

数据集成解决方案探讨

ID:20999643

大小:834.50 KB

页数:25页

时间:2018-10-17

数据集成解决方案探讨_第1页
数据集成解决方案探讨_第2页
数据集成解决方案探讨_第3页
数据集成解决方案探讨_第4页
数据集成解决方案探讨_第5页
资源描述:

《数据集成解决方案探讨》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据集成解决方案探讨2010-09-04目录一、数据集成的必要性二、数据集成主要的三种架构三、数据集成相关技术四、港口数据集成解决方案一、数据集成的必要性1、使企业数据资源形成互通互联的整体在企业发展的过程中,相继实施了多个应用系统,每一个应用系统都有自己的运行环境和数据存储方式,从而产生了各种不同的数据源,需要通过数据集成形成互通互联的整体。2、满足企业决策分析的需要企业管理层越来越需要通过信息系统来分析企业整体运营情况,这就需要对信息资源进行整合,形成统一的系统访问入口,避免造成新的门户孤岛现象。3、有助于规范数据和代码统一通过进行数据集成,有助于将不同系统内的代码进行规范,

2、形成企业统一的代码标准。二、数据集成主要的三种架构单个系统的数据集成架构这是目前主要的数据集成架构,主要是以数据仓库系统为代表,集成企业主要基础信息系统的数据,经过ETL(清洗、转换、装载)后,转换为统一标准,按照星形或雪花型模型存储海量数据,面向企业的人、财、物等主题进行数据分析或挖掘。特点是多对一架构,转换条件复杂,支持TB级的数据量处理和加载,数据存储结构比较特殊,数据加载层级比较清晰。缺点是数据实时性不高、程序编程量较大,数据是单向传递的。企业统一数据集成架构这种架构适合于像大型银行、税务、电信等业务比较独立、组织结构比较复杂的单位,如银行的总行和分行间的数据交换。对于企

3、业主要信息系统的数据可直接来自数据中心,摆脱了没有企业数据中心前的一对多交叉的问题,可有效避免业务系统对应多种管理系统时需要数据重复传送,比如某个业务系统新增了一个客户信息,可直接由数据集成平台发送至数据中心,然后由数据中心根据需要将该信息发送至相关业务系统即可。这种架构的特点是属于多对多、数据交换频繁、数据接口和数据类型比较繁多,可实现数据双向交换。企业统一数据集成架构机构之间数据集成架构这种架构一般应用于跨企业、跨机构的数据集成和交换,通过制定统一的数据标准,从而形成一个多机构间的数据集成平台,比较典型的是银联和各商业银行间的数据集成。这种架构相对比前两种架构,具有跨多企业、

4、单位之间多对多,网络交换较为复杂,数据安全性和实时性较高。机构之间数据集成架构三、数据集成相关技术1、ETL技术一是采用手工编程或专项ETL工具,这种方法是目前使用较为广泛的方法,适合满足较为复杂的数据集成需要。具体方式有PB、JAVA、存储过程、C/C++等,优点是比较灵活,但存在多一种系统的数据集成就会多一倍的工作量,可拓展性和实时性较差;另外也有针对具体某个行业如银行的专项ETL工具,可减少部分工作量,但具有较大的局限性,不能够通用。手工编程模式二是采用商品化的数据集成软件,如InformaticaPowerCenter、IBMDataStage、OracleODI等,这些

5、软件可在较大程度上减少人工编程量,提高效率。2、数据联邦技术通过数据联邦技术可使数据逻辑看上去存在一个位置,但实际的物理位置却可能在多个数据源中。数据联邦技术提供了一种为数据提供抽象的数据接口的能力。这些多个数据源组成的虚拟视图可以使用户不需要知道数据的物理位置、数据结构和保存方式。和传统数据集成方式相比,不需要建立中央数据库,不保存实际数据,可以最大限度的保证数据的实时性,前提是首先要有统一的代码标准,否则数据集成质量较差。数据联邦技术适合于对集成数据实时性要求比较高,数据经常变换的环境下,不适合于包含过于复杂数据转换,数据集特别巨大,否则会使数据转换的效率降低。比较典型的有B

6、EAAquaLogicDataServicesPlatform、IBM—FederationServer等。3、基于SOA的数据集成数据联邦技术从本质上讲并非真正意义的数据集成,更接近一种数据库视图的方式,但一定程度上解决了集成实时性的问题,近年来,出现了基于SOA架构的数据集成,一般包括两个过程,一是对数据按照SOA架构的需要进行整合加工形成可用的信息,二是将信息以符合SOA规范的方式发布出去。3.1基于ODS(操作性)的数据集成这是其中的一种实时数据集成模式,是基于数据仓库演化而来。这种方式 将分散在数据层的数据先整合到ODS或者数据仓库中进行整合加工,然后再将加工整理后的数

7、据以标准接口发布到中间件层。建立一个全局的操作型数据库ODS(operationaldatastorage),该数据库与企业内的其它数据源通过变化数据捕捉(ChangeDataCapture)方式(包括日志对比、时间戳、全表对比等)保持实时同步,当数据源内的数据发生变化时,CDC会捕捉到变化的数据并通过ETL工具或者其它手段(如主数据管理工具)同步到ODS数据库中。ODS数库内存储的数据可以分为三层,如下图所示3.2基于中间件的数据集成这种模式,数据集成和发布都发生在中间件层,在

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。