欢迎来到天天文库
浏览记录
ID:52743902
大小:63.00 KB
页数:2页
时间:2020-03-30
《浅析元数据在数据仓库中的应用.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、摘要:元数据作为存储数据的数据,在各种数据仓库教材中都涉及到元数据的管理知识,但是在实际应用中对于元数据的管理却使用的很少,大多数据仓库开发人员都了解元数据的重要性,但是在真止应用中却很少使用,或者说不知道如何构建元数据库,本文就针对元数据的管理以及在SqlServer2005中的具体实现。中国论文网关键词:元数据数据仓库数据模型程序设计中图分类号:TP311.13文献标识码:A文章编号:1672-3791(2012)05(c)-0034-01元数据是整个数据仓库的核心,它描述了仓库中的各个数据对彖,遍及仓
2、库的齐个方面,同时它在数据仓库的建造及运行中起着极其重要的作用。血元数据大致分为关于数据源的兀数据,数据模烈的元数据,数据仓库映射的兀数据以及数据仓库使用的兀数据的四个方面类型。(1)数据源的元数据。关于数据源的元数据在利用这类元数据时对不同数据源平台上的物理结构和含义是现有系统业务数据源的描述信息。英具体有以下几点:①数据源中所有物理数据结构,包括所有的数据项及数据类型。②所有数据项的业务定义。③每个数据项更新的频率,以及山谁或哪个过程更新的说明。④每个数据项的有效值。⑤其他系统中具有相同业务含义的数据项
3、清单。(2)数据模型的元数据。关于数据模型的元数据是数据仓库管理的基础,同吋描述了仓库中有说明数据以及数据之间的关系。当一些用八提出需耍哪些农系统就能从中选出这个农,这就说明了元数据可以支持用户从数据仓库中获収数据。通过这种关系表用户就能获収很多希望数据。描述数据仓库屮的数据及数据之间的齐种复杂关系,元数据要定义以下内容。数据仓库中描述数据及数据Z间的务种复杂的关系,现定义以下内容:①I/O对象:元数据在描述I/O对彖的定义、类型、状态以及存档周期都是支持数据仓库I/O操作的各个对彖。②关系:两个I/O对象
4、之间是关联的。这种关联有三种类型分别是一对一、一对多和多对多。③关系成员:描述每个关系中两个I/O对象的具体角色(在一对多中是父亲还是儿子)、关護(一对一述是一对多)以及约束条件(必须满足述是可选关系)。④关系关键字:描述两个I/O对象如何建立关联。每个关系都是通过I/O对象的关键字來建立的,元数据要指明建立每个关系的相应对象的关键字。(3)数据仓库映射的元数据。数据仓库映射的元数据是数据源与数据仓库数据之间的映射,当数据源的数据项与数据仓库建立映射关系时,就要记下这些数据项发生的一些转换、变换和加载的过程
5、。就是用元数据反映数据仓库的数据项是从转换、变换和加载过程这些特定的数据源填充的。而转移元数据的数据到数据仓库的目标数据是一件复杂的工作,其工作量占整个数据仓库的80亂其主耍涉及以下两方而:①抽収工作之间的复杂关系。②源数据与目标数据之间的映射。(4)关于数据仓库使用的元数据,数据仓库使用的元数据时対数据仓库中信息使用情况的描述。数据仓库的用八最关心的是以下两类元数据。①元数据描述数据仓库屮有什么数据,它们从哪里來,即如何按主题杳看数据仓库的内容。②元数据提供己有的,可重复利用的查询语言信息。如果某个杏询能
6、够满足他们的需求,或者与他们的愿望相似,他们就可以再次使用那些查询而不必从头开始编程。1元数据的管理随看元数据越來越成为公司重要的资源,就越来越需要完善的元数据管理功能,包括:(1)支持企业范围内的体系结构。企业在开发应用程序、封装应用程序、决策支持数据库时,他们关心的是软件设计与开发、用户接口、操作管理、应用程序内部的消息传递、数据的协同工作能力。所有这些都驱使开发人员去理解各种元数据目录,以及它们在企业范围内的体系结构的作用°(2)基于知识库的方法。元数据一般存储在其特定工具相关的属性知识库中。因此,企
7、业可以要求捉供一利
8、机制,可以将其特定工具支持的元数据无缝地转移到一个共享的、公共的元数据知识库中。(3)配置管理。元数据知识库必须提供标准的配置管理能力,如注册、退出、版本控制等。还需要提供抽取、修改元数据的定义以及将其定义存到知识库中,此外,还必须具有在必要的时候将元数据恢复到某一个前版本的功能。(4)支持开放的元数据交换标准。企业内部和外部对元数据的访问导致了对开放的元数据交换标准支持的需求。至少企业元数据应该支持MDIS(元数据交换标准)。(5)动态交换和同步。金业应该采用MDIS标准,实现动态交换
9、或同步,否则需要一■个开放的元数据交换工具。2元数据在SqlServer2005中的应用2.1概念元数据描述0LTP中的表、数据仓库、数据集市和OLAP多维数据集等对象,还记录程序引用的对象。2.2具体实现和元数据的获取在SqlServer2005中-•般山数据库系统本身产生元数据,或者在相应编程中产生元数据,不需要用户自C创建,当然用户也可以自C创建。例如在Dot.Net创建多维数据集时,自动产生XML格式的元
此文档下载收益归作者所有