数据仓库中的元数据.ppt

数据仓库中的元数据.ppt

ID:48185379

大小:8.96 MB

页数:66页

时间:2020-01-16

数据仓库中的元数据.ppt_第1页
数据仓库中的元数据.ppt_第2页
数据仓库中的元数据.ppt_第3页
数据仓库中的元数据.ppt_第4页
数据仓库中的元数据.ppt_第5页
资源描述:

《数据仓库中的元数据.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十四章数据仓库元数据提纲元数据概念元数据重要性元数据类型元数据管理提纲元数据概念元数据重要性元数据类型元数据管理什么是元数据meta-data描述数据的数据,是存取和管理数据的依据描述数据的含义和性质,以便更好地理解、管理和使用数据的数据示例数据:图书馆中的书籍元数据:标题、作者、关键词、ISBN号数据:1,1,2,3,5,8,13……元数据:数据仓库元数据的称谓关于数据的数据数据内容表数据目录数据仓库地图数据仓库路标数据仓库目录将数据仓库结合到一起的黏合剂神经中枢数据仓库元数据内容数据模型的说明

2、数据的定义/描述数据单元之间的关系数据仓库的表结构数据仓库的表属性数据仓库的源数据从记录系统到数据仓库的映射抽取日志访问数据的公用例程数据仓库元数据示例Customer实体的元数据元素实体名称:Customer别名:Account,Client定义:从公司购买产品或服务的一个人或者一个机构备注:客户实体包含了常规的,当前以及过去的客户源系统:已经完成的产品订单,维护合同,在线销售建立日期:1999年1月15日最后更新日期:2001年1月21日更新周期:每周最后的完全刷新日期:2000年12月29日数

3、据质量回顾:2001年1月25日最后的副本:2001年1月10日计划归档:每6个月负责用户:JaneBrown提纲元数据概念元数据重要性元数据类型元数据管理元数据的重要性:导航元数据的重要性:导航操作型环境中,用户通过图形界面或预定义报表访问信息;数据仓库用户则是自己创建查询来获取信息在创建并运行查询之前,用户需要借助元数据来了解数据仓库中数据的含义,避免错误的引用分析而导致错误的结论随着数据仓库的范围越来越广,规模越来越大,需要足够的元数据来支撑数据仓库用户的访问元数据的重要性:导航有预定义的查询

4、可看吗?数据仓库中的各种数据元素是什么?有没有按产品分类的关于销售和成本的数据?我怎么浏览可用的数据?他们从哪些源系统为数据仓库获取数据?他们如何合并电话订单系统和邮件订单系统的数据?数据仓库中的数据最早是什么时候的?最后一次导入数据是什么时候?有没有按照月份或者产品进行的汇总?元数据的重要性:构建为完成数据的抽取和转换,需要了解源系统的数据结构,数据仓库的结构,确定源系统到目标系统的映射以及数据转换的规则为完成数据仓库的物理设计和初始装载,需要了解数据仓库逻辑结构的元数据,需要知道数据刷新的元数据

5、等等元数据的重要性:管理数据抽取/转换/装载如何处理数据变化?如何包括新的源系统?如何清洗数据?如何改变数据清洗的方法?如何转换成新的数据转换技术?如何审计应用的改变?元数据的重要性:管理数据仓库如何增加新的汇总表?如何控制运行的查询?如何扩展存储?何时规划平台升级?如何为用户增加新的信息传递工具?如何继续培训?如何维护并扩展用户支持功能?如何管理并提高即席查询的性能?什么时候安排备份?如何执行运行灾难恢复演习?如何保持数据定义是最新的?如何维护系统的安全?如何监控系统的负载分布?元数据的重要性:管

6、理外部系统的数据如何增加新的外部数据源?如何去掉某些外部数据源?如果合并或者获取数据,如何将新的数据加入到数据仓库中?如何检验所有的外部数据?元数据的重要性:管理元数据的重要性:神经中枢元数据的重要性:人员IT专家高级用户一般用户信息发现数据库,表,列,服务器平台数据库,表,列预定义的查询以及报表以及商业视图的列表数据的意义数据结构,数据定义,数据映射,清洗功能,转换规则商业术语,数据定义,数据映射,清洗功能,转换规则商业术语,数据定义,筛选,数据源,转换,数据所有者信息访问用SQL,第3代语言,第

7、4代语言编写的程序代码,前端应用,安全性查询工具集,复杂分析所需要的数据库访问鉴权请求,信息获取倒入桌面应用(例如电子表格)元数据的重要性:最终用户依靠元数据导引,寻找问题答案销售情况能按照产品、促销、商店和月份进行分析吗?当月的销售能与去年同期的销售进行比较吗?销售情况能与预期目标进行比较吗?利润率是如何计算的?商业规则有哪些?销售区域是如何划定的?需要分析的区域包含哪些地区?销售数据从何而来?来自哪些源系统?销售数据是什么时候的?多久更新一次?元数据的重要性:最终用户数据内容汇总数据商业维度商业

8、指标浏览路径源系统外部数据数据转换规则最后更新日期数据装载/更新周期查询模板报表格式预定义查询/报表OLAP数据对最终用户重要的元数据元数据的重要性:IT人员IT人员:设计和管理数据仓库元数据发挥重要作用的流程从源系统中抽取数据数据转换数据清洗数据汇总数据刷新数据库设计查询和报表设计元数据的重要性:IT人员源数据结构源平台数据抽取方法外部数据数据转换规则数据清洗规则准备区域结构维度模型初始装载增量装载数据汇总OLAP系统Web访问查询/报表设计对IT人员重要的元数据元

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。