欢迎来到天天文库
浏览记录
ID:47512112
大小:736.50 KB
页数:14页
时间:2020-01-12
《元数据管理模块方案》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、.....目录1.现状分析11.1目前的困境21.2什么是元数据管理22.目标分析32.1建立完善的指标解释体系32.2建立规范的元数据管理体系32.3建立有效的数据稽核体系43.功能概述43.1元数据管理43.1.1业务元数据43.2.2技术元数据53.3元数据分析73.3.1血统分析83.3.2影响分析83.3.3重要性分析83.3.4无关性分析83.4数据稽核93.4.1稽核规则管理93.4.2稽核任务调度93.4.3稽核结果分析103.4.4数据质量评估103.4.5数据问题管理10学习参考
2、.....元数据管理系统概述1.现状分析随着经营分析系统规模不断扩大,系统所积累数据量也越来越大,收集到的海量数据背后隐藏着大量珍贵重要的信息,但也同时提高了系统的数据管理难度:一方面难以对这些数据进行有效解释,缺乏对业务流程执行的实时监控和管理;另一方面各部门数据与数据整合的难度也不断加大,影响到了经营分析系统中的数据质量。如何对现有数据进行深层发掘,并揭示出埋藏在元数据中的趋势、因果关系、关联模式等核心信息?这是下一步深化经营分析系统应用的电信运营商需要解决的头等大事。构建BI,首先要保证的是数
3、据质量。元数据管理解决的问题就是如何把业务系统中的数据分门别类地进行管理,并建立数据与数据之间的关系,为数据仓库的数据质量监控提供基础素材。1.1目前的困境使用者(决策层、业务分析人员):1)经营分析系统中存在有很多报表,不同报表中存在一些相同的指标,这些指标往往不一致,给业务分析和决策工作造成很多困惑,必须花费很大的精力去检查核实。2)对于很多指标,不清楚其具体含义,不清楚其反映的问题,不清楚其具体算法和来龙去脉。数据仓库项目开发维护者:1)不同报表中的同一指标不一致,必须花费很大的精力去检查,目
4、前基本上是通过手工检查表和存储过程的方式,效率较低。2)没有完善的开发、维护规范。比如,新增一张分析报表,开发人员根据业务人员的需求制作完成之后,往往没有整理完善相应的数据指标解释和元数据管理,造成日后检查困难。3)开发、维护规范的执行力较低,没有行之有效的管控手段。学习参考.....不严格按照规范执行,随着项目的发展和时间的推移,导致数据仓库项目的健壮性和可维护性呈几何级数下降,给数据仓库的建设带来大量的重复工作。1.2什么是元数据管理元数据最本质,最抽象的定义为:dataaboutdata(关于
5、数据的数据)。而对于经营分析数据仓库而言,形象的定义为:元数据就是数据仓库的规范。这些规范包括对各种指标的定义、解释;包括对各表中数据的来龙去脉、数据的大小和格式的定义。元数据管理,就是要建立一套行之有效的规范以及该规范的管控体系,实现从管理到查询到综合分析的全面管控,管理层次从接口到ETL处理、业务逻辑处理、结果展现处理和指标分析的方方面面,构成数据仓库应用系统的核心和基础。做到开发者能严格遵守规范,维护者和使用者有规范可查,有力的保障数据仓库项目的健壮性和可维护性。2.目标分析要走出目前的困境,
6、有下面三个方面的问题急待解决:2.1建立完善的指标解释体系满足用户对业务和数据理解的需求,建立标准的企业内部知识传承的信息承载平台,建立业务分析知识库,实现知识共享。能够回答诸如以下问题:什么是出帐用户数?在网用户数和网上用户数有何区别?什么是套餐的生命周期?竞争对手新发展用户数是怎么得来的?这个数据还叫什么名字?…………学习参考.....2.2建立规范的元数据管理体系让用户能够清晰的了解数据仓库中数据流的来龙去脉,业务处理规则、发展情况等,提高系统的可维护性、适应性和集成性,支持数据仓库/集市的成
7、长需求,减少因员工换岗造成的影响。具体来讲,主要是对数据仓库建设、运行和维护的规范的管理。能够回答诸如以下的问题:哪张表是从业务系统抽取过来的原始话单表?竞争对手新发展用户事实表中的数据,是从哪些表汇总计算出来的?DW用户下的P_XXX这个存储过程是谁写的,现在还有用吗?我是新手,要生成套餐生命周期演化分析事实表,我该怎么做?表空间不够了,哪些表的数据可以删掉?…………2.3建立有效的数据稽核体系促进数据仓库的数据质量建设,为提高整个系统的数据质量奠定坚实的基础。建立报警、监控机制,出现故障,能及时
8、发现问题。提供整体系统运营的情况分析。能够回答诸如以下问题:今天的出帐用户数过高,是怎么回事?数据集市层中的DM_XXX表中数据为空,什么原因?A报表中的全省ARPU值和B报表中的ARPU值为什么不同?…………3.功能概述3.1元数据管理对数据仓库的层次结构、主题域划分,各层的各种对象,如表、存储过程、索引、数据链、函数和包等的管理。能够清晰的展现各层次结构之间的数据流程,图形化展现各对象之间的关系,展现表中数据的来龙去脉。学习参考.....3.1.1业务元数据业务元
此文档下载收益归作者所有