数据质量学习资料.ppt

数据质量学习资料.ppt

ID:59593588

大小:372.00 KB

页数:23页

时间:2020-11-14

数据质量学习资料.ppt_第1页
数据质量学习资料.ppt_第2页
数据质量学习资料.ppt_第3页
数据质量学习资料.ppt_第4页
数据质量学习资料.ppt_第5页
资源描述:

《数据质量学习资料.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据质量管理什么是数据质量何谓数据质量可从两个方面来理解:第一:数据本身的数据质量数据的真实性:数据必须真实准确的反映实际发生的业务。数据的完备性:数据的完备性是说数据是充分的,任何有关操作的数据都没有被遗漏。什么是数据质量数据的自洽性:数据并不是孤立存在的,数据之间往往存在着各种各样的约束,这种约束描述了数据的关联关系。数据必须能够满足这种数据之间的关联关系,而不能够相互矛盾。数据的真实性、完备性、自洽性是数据本身应具有的属性,称为数据的绝对质量,是保证数据质量的基础。除了数据的绝对质量外,还有我们在

2、利用和存贮数据的过程中所产生的数据质量,包括使用质量、存贮质量和传输质量,称之为过程质量。什么是数据质量第二:数据的过程质量数据的使用质量:数据的使用质量是指数据被正确的使用。再正确的数据,如果被错误的使用,就不可能得出正确的结论。数据的存贮质量:数据的存贮质量是指数据被安全的存贮在适当的介质上。所谓安全是指采用了适当的方案和技术来抵制外来的因素,使数据免受破坏,备份是我们常使用的技术,包括异地备份和双机备份什么是数据质量数据的传输质量:数据的传输质量是指数据在传输过程中的效率和正确性。在现代信息社会中

3、,数据在异地之间的传输越来越多,保证传输过程中的高效率和正确性非常重要。为什么要建立数据质量管理体系目前企业存在多地区,多产品,多业务,多系统的环境,在数据信息,报表统计,业务分析和业务元定义上存在数据不一致,不完整,不统一以及不真实和不及时的情况,这样让业务人员,管理者,信息使用者存在误解,导致决策出现偏差,同时低下的数据质量往往造成开发出来的系统与用户的预期大相径庭,而在维护阶段,也出现维护成本不断上升,工作量加大,系统难以扩展。这样的情况急切等待数据质量管理的标准和指导方案.数据质量管理的范围数据

4、质量管理是针对企业在建设数据仓库,数据挖掘和数据中心时存在的数据质量问题提出的解决方案和指导评估标准,所以数据质量管理模型项目是1、数据质量管理规范和数据质量问题的解决方案,不是软件和产品,更不是数据模型和ETL模型;2、只针对重构数据和目标数据进行修改,而不对源数据进行修改;3、提供源数据的检测分析以及质量报告,不对业务模型进行分析;4、可以用作主数据管理,数据仓库和数据挖掘系统作为参考,但不包含此类系统的构架模型 ;数据质量管理项目构架项目涉及到数据质量的分析和验证,因此有数据的分析流程和数据的管理

5、流程,如下图:数据质量管理项目构架首先是分析源数据系统,从业务和数据本身的角度剖析,包括对数据源中存储的逻辑定义,表结构,视图结构,约束,触发器,唯一性等等,得出相关的定义。由定义以及定义的关联产生相应的业务规则和数据逻辑规则。数据的验证引擎利用这些产出的规则,对源数据和目标数据进行校验,并对应校验规则保存校验结果;修正引擎用业务和数据逻辑的修正规则对校验结果进行自动修正和提供手动修正接口,同时保留修改前后的记录;数据质量管理项目构架在数据质量管理模型中,需要对数据检验结果和修正结果进行分析,利用校验结

6、果发现数据源和数据流程中存在的问题,同时可以参考修正记录,对数据的质量提出适当的改进策略,并采取适当的行为。数据质量管理项目构架项目包括的主要任务有源系统剖析:源数据剖析的深度和业务层次,来定义数据语义的一致性,将企业相关数据元就行分析,看看各系统间数据的不同部门对数据的定义,这是确定数据含义是否一致。数据质量管理项目构架元定义:原系统的数据剖析是对分析各个原系统的数据存储的结构,包括表数据,视图数据,Excel数据等以及计算公式,比较方式,查看数据方式,都数据剖析的范围,这需要一个比较可行的方式,对于

7、数据库中的内容,需要有相应的导出完整数据字典的结构过程,能在Excel中修改,也能导入到制定的表中进行保存,同时还能定期检查表结构是否发生变化。数据质量管理项目构架数据验证:这里的验证有几种,数据结构验证,还有数据一致性,完整性,唯一性和准确性的验证,每一种验证就需要建立固定的可变化的验证规则,而且验证规则,验证体,验证结构都需要记录日志和验证结果,同时还需要提供接口给UI,最好能做到让业务人员自己更新验证规则,自己查看验证过程和结果,为数据修补引擎提供接口。数据质量管理项目构架数据修正:针对不同类型的

8、数据验证规则验证的数据进行更新,有指定规则自动更新的,有人工干预修改的,主要是能有UI接口,提供修改功能和修改策略,以及记录修改日志和标记。便于和正常数据区分。数据质量管理项目构架元数据管理:数据质量的元数据管理是贯穿整个解决方案体系,从数据剖析到最后的质量检测和管理部分,记录管理元数据,操作元数据,业务规则元数据,验证规则和修正规则等元数据,它是数据质量管理模型的灵魂。数据质量管理项目构架检验分析:这里的分析报表,如可以利用6Sigma的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。