深入浅出数据治理

深入浅出数据治理

ID:22455653

大小:850.18 KB

页数:45页

时间:2018-10-29

深入浅出数据治理_第1页
深入浅出数据治理_第2页
深入浅出数据治理_第3页
深入浅出数据治理_第4页
深入浅出数据治理_第5页
资源描述:

《深入浅出数据治理》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、深入浅出数据治理45目录一数据管理的现状3二数据治理的概述4(一)数据治理概念4(二)数据治理目标5三数据治理体系5四数据治理核心领域6(一)数据模型6(二)数据生命周期6(三)数据标准8(四)主数据9(五)数据质量10(六)数据服务12(七)数据安全12五数据治理保障机制13(一)制度章程13(1)规章制度13(2)管控办法13(3)考核机制13(二)数据治理组织15(1)组织架构15(2)组织层次16(3)组织职责17(三)流程管理19(四)IT技术应用19(1)支撑平台19(2)技术规范22附件A数据管理规范2

2、3附件B数据质量评估办法38附件C数据质量管理流程4245关于数据治理的理解1.数据管理的现状根据行业信息化发展的现状,结合当今行业数据治理的要求,大型集团或政务管理部门现阶段数据管理方面存在以下的不足:(1)数据多头管理,缺少专门对数据管理进行监督和控制的组织。信息系统的建设和管理职能分散在各部门,致使数据管理的职责分散,权责不明确。组织机构各部门关注数据的角度不一样,缺少一个组织从全局的视角对数据进行管理,导致无法建立统一的数据管理规程、标准等,相应的数据管理监督措施无法得到落实。组织机构的数据考核体系也尚未建立

3、,无法保障数据管理标准和规程的有效执行。(2)多系统分散建设,没有规范统一的省级数据标准和数据模型。组织机构为应对迅速变化的市场和社会需求,逐步建立了各自的信息系统,各部门站在各自的立场生产、使用和管理数据,使得数据分散在不同的部门和信息系统中,缺乏统一的数据规划、可信的数据来源和数据标准,导致数据不规范、不一致、冗余、无法共享等问题出现,组织机构各部门对数据的理解难以应用一致的语言来描述,导致理解不一致。(3)缺少统一的主数据,组织机构核心系统间的人员等主要信息并不是存储在一个独立的系统中,或者不是通过统一的业务管

4、理流程在系统间维护。缺乏对集团公司或政务单位主数据的管理,就无法保障主数据在整个业务范围内保持一致、完整和可控,导致45业务数据正确性无法得到保障。(4)缺乏统一的集团型数据质量管理流程体系。当前现状中数据质量管理主要由各组织部门分头进行;跨局跨部门的数据质量沟通机制不完善;缺乏清晰的跨局跨部门的数据质量管控规范与标准,数据分析随机性强,存在业务需求不清的现象,影响数据质量;数据的自动采集尚未全面实现,处理过程存在人为干预问题,很多部门存在数据质量管理人员不足、知识与经验不够、监管方式不全面等问题;缺乏完善的数据质量

5、管控流程和系统支撑能力。(5)数据全生命周期管理不完整。目前,大型集团或政务单位,数据的产生、使用、维护、备份到过时被销毁的数据生命周期管理规范和流程还不完善,不能确定过期和无效数据的识别条件,且非结构化数据未纳入数据生命周期的管理范畴;无信息化工具支撑数据生命周期状态的查询,未有效利用元数据管理。1.数据治理的概述1.1数据治理概念数据治理是指将数据作为组织资产而展开的一系列的具体化工作,是对数据的全生命周期管理。数据治理体系是指从组织架构、管理制度、操作规范、IT应用技术、绩效考核支持等多个维度对组织的数据模型、

6、数据架构、数据质量、数据安全、数据生命周期等各方面进行全面的梳理、建设以及持续改进的体系。1.2数据治理目标数据治理的目标是提高数据的质量(准确性和完整性),保证数45据的安全性(保密性、完整性及可用性),实现数据资源在各组织机构部门的共享;推进信息资源的整合、对接和共享,从而提升集团公司或政务单位信息化水平,充分发挥信息化作用。1.数据治理体系数据治理体系包含两个方面,一是数据质量核心领域,二是数据质量保障机制。具体两者内容及相互关系可以参见下图:2.数据治理核心领域为了有效管理信息资源,必须构集团级数据治理体系。

7、数据治理体系包含数据治理组织、数据构架管理、主数据管理、数据质量管理、数据服务管理及数据安全管理内容,这些内容既有机结合,45又相互支撑。1.1数据模型数据模型是数据构架中重要一部分,包括概念数据模型和逻辑数据模型,是数据治理的关键、重点。理想的数据模型应该具有非冗余、稳定、一致、易用等特征。逻辑数据模型能涵盖整个集团的业务范围,以一种清晰的表达方式记录跟踪集团单位的重要数据元素及其变动,并利用它们之间各种可能的限制条件和关系来表达重要的业务规则。数据模型必须在设计过程中保持统一的业务定义。为了满足将来不同的应用分析

8、需要,逻辑数据模型的设计应该能够支持最小粒度的详细数据的存储,以支持各种可能的分析查询。同时保障逻辑数据模型能够最大程度上减少冗余,并保障结构具有足够的灵活性和扩展性1.2数据生命周期一般包括数据生成及传输、数据存储、数据处理及应用、数据销毁四个方面。(1)数据生成及传输数据应该能够按照数据质量标准和发展需要产生,应采取措施保证数据的准确性和完

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。