《数据元标准化的基本原则与方法》 标准培训教材.pdf

《数据元标准化的基本原则与方法》 标准培训教材.pdf

ID:52911417

大小:98.63 KB

页数:6页

时间:2020-03-31

《数据元标准化的基本原则与方法》 标准培训教材.pdf_第1页
《数据元标准化的基本原则与方法》 标准培训教材.pdf_第2页
《数据元标准化的基本原则与方法》 标准培训教材.pdf_第3页
《数据元标准化的基本原则与方法》 标准培训教材.pdf_第4页
《数据元标准化的基本原则与方法》 标准培训教材.pdf_第5页
资源描述:

《《数据元标准化的基本原则与方法》 标准培训教材.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、科学数据共享通用标准培训系列教材《数据元标准化的基本原则与方法》标准培训教材科学数据共享工程办公室2006年2月1目的意义简单地讲,该标准要解决一些几个方面的主要问题:什么是数据元,干什么用;它的基本属性是什么,如何规范地写出这些属性;产生了大量的数据元后如何管理。数据元标准化的目的,概括地讲,就是要通过元数据的所有元素以及具体数据的数据单元(数据元)的标准化,使得数据的拥有者和使用者,对数据有着共同、一致和无歧义地理解。那么,如何实现这一点呢,就必须首先规定数据元标准化的原则和一些基本的方法。本标准的目的就在于给出科学数据共享工程、各领域、主体数据库三个层面的数据以及关联数

2、据,在其特定的语境中数据单元进行标准化的原则、方法以及管理的机制和模式。它不仅是科学数据共享三个层面各自内部数据规范的原则与方法,同时也是元数据元素和元数据内容规范的原则与方法。它不仅是科学数据大平台建设中数据规范、公共数据元目录编写必须遵循的原则与方法,更是各试点单位相关库结构设计和数据字典编写的依据和基础。对内,可以作为科学数据采集、加工、处理环节工作人员的操作“手册”或工作“指南”,使其有标准可依,在分析业务流程和所关心对象、其特性和可能表示的前提下,提取所需的数据元和属性,按照本标准规定的原则和方法,对其进行标识、命名、定义等,同时提交注册。对外,可以使有关方,根据本

3、标准以及由此产生的数据元目录、字典,对科学数据的进行相应汇交、分发、服务和应用。上述这些活动都必然建立在数据使用者和数据拥有者对相关数据的涵义、表示及标识有着相同而无歧义的理解基础上。最后,本标准是科学数据共享工程、各个领域以及主题数据库设计和建设工程中数据(元)目录、数据(元)字典以及更高、更理想应用层次的数据元注册系统的顶层、基础方法性标准。一般与目录、字典或注册系统的应用说明书等一起提供给用户。2标准内容首先,本标准文本中的范围已经基本给出了标准的主要内容:1本标准围绕各种类型的科学数据库建设和整合以及科学数据交换、共享、服务和应用对数据元标准化的需要,规定了数据元的提

4、取、命名、标识、描述、分类、值域范围确立的基本原则与方法,数据元目录的格式规范,以及整个科学数据共享工程中数据元的维护与管理层次与机制。2本标准适用于科学数据共享工程各建设单位研究和制定通用和专用的数据元目录(又称数据元字典)标准。其次,本标准围绕各种类型的科学数据库建设和整合以及科学数据交换、共享、服务和应用对数据元标准化的需要,从业务实现的功能模块的角度来看,重点要解决科学数据共享过程中的:Ø数据元如何提取Ø数据元如何命名和标识Ø数据元如何描述与表示Ø数据元的分类Ø数据元的值域Ø数据元目录的编写格式从逻辑思维、便于阅读、理解的角度,标准文本包含以下几个板块:什么是数据元;

5、数据元的基本属性有哪些;如何提取数据元及其属性;数据元的分类法;数据元的标识和命名原则与方法;数据定义编写的原则与方法;数据元的值域及表达模式;数据元目录的编写格式;以及如何进行数据元的管理与维护。3标准应用3.1数据元和数据元属性的提取对于以现有数据库为主的领域中科学数据共享来说,数据元和属性提取的方法上宜采用“自下而上”的方法为主。工作流程可能有两种方式和途径。一是直接由各个主体数据库,依据本标准规定的原则和方法,对自身的数据库等相关数据资源的数据在分析、梳理基础上,归纳整理出各自数据库数据元;根据数据元的应用实际和数据库的具体要求,阐明并写出相关数据元在采集、存储和交换

6、过程中各个属性以及属性的约束要求;描述和定义各个属性所需要的属性描述符及其约束要求;根据给定的命名、定义、标识规则和表示规范,形成各自数据库的数据(元)字典;根据领域和工程的需要,提交领域、共享工程层面的数据元。二是各个领域先依据本标准制定各领域的具体数据元标准化的原则和方法标准和数据元目录标准规定,供相关领域和其所属的主题数据库建设和设计参考、使用,并形成领域的数据元目录以及各个主题数据库的数据(元)字典。当特定领域与共享工程层面的数据元标准化的原则、方法虽然兼容,但延拓、细化以及具体需要规定的内容较多时,可采用此种途径和方式。对于根据科学数据的发展为出发点,在领域建设中以

7、新建各类主题数据库为主时,领域层面科学数据共享中的数据元和属性的提取方法宜采用“自上而下”方法为主,基本步骤是,在业务流程和功能分析的基础上,通过建模分析、确立关心“对象”;通过对象类的特性以及相关表示的分析、归纳和整理,提出所需的数据元;根据不同主题数据库不同的功能要求和不同结构数据的描述要求,提出规范数据元所需的属性及其属性描述符;规定属性和属性描述符的规范性要求;依据属性和属性描述符规范对提取的数据元进行标准化;形成不同主题库和领域的数据(元)字典(或目录)。3.2对象词、特性词和表示词的应用作为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。