欢迎来到天天文库
浏览记录
ID:35514535
大小:1.13 MB
页数:16页
时间:2019-03-25
《dmbok数据质量管理》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、DMBOK:元数据管理2011-12-2621:43:30标签:DMBOK原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将追究法律责任。http://zhoujg.blog.51cto.com/1281471/751610 BI的成功运用深度依赖于有效的元数据管理,通常被称作"关于数据的数据"。元数据为所有BI系统的数据充当路标,从而能够对这些数据迚行高效地管理、控制发更和分发。全面的元数据管理保证了BI系统具有高质量的信息,并提供充分的扩展性,能满足新的信息需求和数据源增加。元数据实施也是信息集成中的一部分,
2、最重要的工作是将存储在各种工具中的元数据进行整合。元数据管理是数据管理框架的第九个数据管理功能,本篇将介绍一下这个功能。1DMBOK的元数据管理1什么是元数据? 元数据通帯被称作"关于数据的数据",即用于描述其它数据的数据。对于数据可以通过多种方式进行解释,例如 当我们说元数据是"关于数据的数据"时,我们需要确保所讨论的是数据的背景,而不是有关数据的详细细节或相关数据。元数据描述的是数据的背景、内容、数据结构及其生命周期管理。简而言之,元数据是"数据的背景"。 元数据管理全景包括三个部分内容:1.元数据模型2.元数据拓扑结构3.元数据管理方法论1元
3、数据模型 元数据是BI架构中的一个重要组件。在BI环境中,元数据管理最主要是能方便地集成不同数据库、数据模型、OLAP和ETL工具所包含的各式各样的元数据。元数据包括业务规则、数据源、汇总级别、数据别名、数据转换规则、技术配置、数据访问权限、数据用途等。设计良好的元数据模型能够提高管理、变更控制和分发元数据的效率,实现无缝的、端到端的跟踪回溯能力。下面举个例子,如果"102250RichardKing"是数据,下面则是元数据:·员工代码类型为Number(6)——这告诉我们该数据中首6位字符是数字类型,代表员工代码;·员工姓名类型为Varchar(3
4、0)——这告诉我们后面的30位字符是发长字符类型,表示员工姓名。这些元数据可以迚一步抽象为元-元数据(Meta-Metadata),表示元数据的背景。1企业数据模型 1BI元数据模型在BI层面,IT/技术元数据被分为两类,被称为:BI技术元数据、数据源元数据·顶层(领域或概念层)在最顶层,业务的主题域可以直接运用于BI技术元数据的报表和分析,继而被映射到数据源元数据反映的源系统中。·中层(实体层)业务实体连接到技术实体,如数据表,立方体和报表等,它们从可用的源表或数据表单直接获取信息。·底层(元素层)最细节的元数据存在于数据元素层。业务元数据中的业务术语映
5、射到技术元数据的对应层,包括数据表、报表及多维立方体的维度/度量。业务用户广泛使用这层元数据。1BI技术元数据BI技术元数据包含了BI环境中丌同层级的所有元数据,迚一步可以细分为三个类型:·信息整合–ETL(数据抽取,转换和装载)元数据·信息存储–数据仓库元数据·信息发布–报表元数据2BIDS元数据管理方法论一个定义良好的元数据管理产品应该保证信息的高质量,同时能够灵活地扩展BI系统新的数据需求和数据源。BIDS作为元数据管理的解决方案之一,提供了一套方法论BusinessIntelligenceforDecisionSupport(BIDS™),该方法论
6、由6个模块组成,如下图:1元数据框架定义元数据管理主要目的在于基于灵活、健壮的架构实现元数据的标准化、集中化。框架定义涉及分析元数据的当前状态、处理过程,并为元数据管理系统提供一个开发蓝图,主要从长远目标、具体目的和高层需求三个方面来描述:1.长远目标
7、元数据管理系统的总体目标如下:o标准化的元数据和数据处理o元数据管理的集中化o元数据信息去重o适应变化的元数据架构2.具体目的元数据管理系统的目的如下:o制定元数据及数据标准化o集中化BI系统的管理和应用o通过非冗余、非重复的元数据信息提高数据完整性、准确性o减少BI系统组件开发、实现、完善及维护的代价o建
8、立灵活的元数据架构,使BI架构顺应变化3.高层需求元数据创建及管理的高层需求可以通过下表中的内容来加以理解。序号需求1.元数据标准化1.1企业内统一术语及沟通标准:使用元数据作为用户的唯一根据,确保所有用户使用一致的名词进行沟通、理解,以及解释业务问题。同时可以消除歧义,保证企业内信息一致性,便于知识和经验的共享。1.2无缝系统集成:ETL过程,尤其是集成过程,依赖与多种多样的数据源和BI系统。标准化的元数据使得不同源系统的数据集成到BI系统时,数据元素的含义是统一的;此外,只有通过标准方法共享元数据的工具或应用程序才允许被集成到BI系统。1.3数据质量提
9、升:定义数据质量校验规则,是ETL元数据的有机组成部分。2元数据集
此文档下载收益归作者所有