欢迎来到天天文库
浏览记录
ID:58015807
大小:1.33 MB
页数:29页
时间:2020-04-07
《商业智能产品.docx》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、一、企业数据仓库1、企业数据仓库概述企业数据平台是商业智能体系的基础,通过建立层次化的数据仓库体系结构、统一的数据模型,整合企业生产系统的数据,从而为数据分析平台和CRM等上层应用提供数据支撑。企业数据平台沉淀了企业多年来的生产经营数据,数据按照存储粒度分为细节级、轻度综合级、汇总级,其数据量通常非常庞大,少则几TB,多则上百TB,而且每天都有大量的生产数据被抽取、整合进入企业数据平台,并传送到数据分析平台和其他系统,以满足其数据需要。如此庞大的数据量、吞吐量和复杂的业务逻辑,对企业数据平台的存取效
2、率、数据质量、易管理性,易维护性等均提出了很高的要求。公司在多年的数据仓库建设过程中研发出一套适用于电信行业的统一数据模型(该模型中的核心部分已经被中国联通作为数据仓库模型的标准规范)。基于统一数据模型、结合数据仓库技术、元数据技术,并对ETL过程进行优化处理,公司实现了电信行业海量数据仓库的标准化构建和高效运转。企业数据仓库(EDW)是企业分析型数据的统一存储,它和运营数据存储一起构成企业的统一数据平台。企业数据仓库在企业内部建立统一的数据架构和数据模型,沉淀来自运营数据存储、生产系统的数据,采用
3、多维分析和数据挖掘手段,细分市场和客户,为企业内各个部门、各个层面的使用者的信息查询获取、经营分析、决策支持等需求提供全方位的数据支撑服务。企业数据仓库从根本上解决了沉淀数据分散重复、共享困难和信息孤岛问题,充分发挥数据资源价值,提高了企业在信息化建设方面的投资回报率。系统架构系统功能1.数据域划分EDW的数据存储按域可以分为:客户域、产品域、市场营销域、服务域、业务域、竞争域。客户域以三户模型为基础,客户域包含客户、客户对产品的订购等相关信息,如客户的基本属性、衍生属性,客户的消费、欠费、缴费、行
4、为、结算、服务、产品订购和业务订购等。数据加工主要是以ODS中的营业域、计费域、帐务域、结算域数据进行整合,按照分层次、分类别、多维度进行数据汇总。产品域以产品模型为基础,包括产品的定价、产品基础信息、产品目录、产品生命周期、产品定位、产品营销等信息。数据加工以ODS的营业域、计费域、帐务域、结算域等数据进行整合,按照分层次、分类别、多维度进行数据汇总。市场营销域包含营销活动、营销能力、营销过程、营销结果、渠道等信息。数据来源是CRM系统的营销活动、营销计划、营销执行、渠道等内容,数据加工在ODS的
5、营业域、帐务域、结算域等数据基础之上按照分层次、分类别、多维度数据汇总加工。服务域主要包含对主动服务和被动服务的信息的分析,包括服务能力、服务过程和服务结果等。数据加工在ODS的客服域基础上进行主动服务和被动服务的数据汇总。业务域从单一业务和组合业务的角度分析企业的经营信息,包含了各业务的发展、收入、使用等信息。数据加工在ODS的客户域、营业域、计费域、帐务域、结算域等数据基础上,按照业务为主线进行分层次多维度数据汇总。竞争域包含竞争对手及其产品、营销、发展、话务等信息。数据加工在ODS的客户域、营
6、业域、计费域基础上,按照对端号码归属电信运营商进行多维度、分层次数据汇总加工。2.数据加工(ETL)ETL是英文Extract-Transform-Load的缩写,提供数据的抽取、转换和加载功能。从源系统中抽取目标数据,按照一定的规则进行清洗、集成、转换、汇总等处理工作,并将处理之后的数据加载到数据仓库的目标层中。为了利用目标数据仓库的并行处理能力,一般先抽取、加载,再做转换处理。3.数据模型支撑企业数据仓库(EDW)是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库
7、,它的数据基于OLTP源系统。数据仓库中的数据是细节的、集成的、面向主题的,以OLAP系统的分析需求为目的。星型模型聚合快、分析效率高,雪花型模型结构明确,便于与其他数据交互,所以EDW一般采用星型、雪花型综合架构采用面向主题方式设计模型,采用自顶向下逐层分解方法设计企业数据仓库模型。主题域是模型针对的业务的某一关注领域或关注点,同一个域内的实体具有高内聚性,不同域的实体之间具有低耦合性。主题域的引入有助于建立模型框架的整体视图。4.元数据管理元数据(Metadata)是关于数据、操纵数据的进程,以
8、及应用程序的结构、意义的描述信息,其主要目标是使数据、程序具有自描述性,使数据、程序更易于管理和维护。在企业数据平台中提供统一的元数据管理手段,对数据库仓库中的元数据进行采集、存储、挖掘,支持查询、分析、维护等操作,使技术人员和业务人员可以统一地对数据仓库中的元数据进行管理和分析,从而更有效地理解和控制企业数据平台的运行。在元数据信息的基础上,通过数据稽核及稽核问题管理,实现对数据质量的管控。1)元数据采集、同步指对表、视图、过程、方法等数据库对象进行扫描,获取各数据
此文档下载收益归作者所有