元数据基本策略研究

元数据基本策略研究

ID:44310516

大小:41.00 KB

页数:9页

时间:2019-10-20

元数据基本策略研究_第1页
元数据基本策略研究_第2页
元数据基本策略研究_第3页
元数据基本策略研究_第4页
元数据基本策略研究_第5页
资源描述:

《元数据基本策略研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、“医药卫生科学数据管理和共享服务系统”是国家科技基础条件平台科学数据共享T程的重要组成部分,该项冃将整合基础医学、临床医学、公共卫生和中医药学等医药卫生领域的数据资源,创建一个物理上分布、逻辑上统一的医药卫生科学数据管理和共享服务系统,为政府卫/决策、医疗保健和科学研究提供数据共享和信息咨询服务。元数据是关于数据的数据,是一种用来描述数字化信息资源,特别是网络信息资源的基本特征及相互关系,从而确保这些数字化信息能够被计算机及其网络系统识别、分解、提取和分析归纳的一种框架或一套编码体系。元数据标准是科学数据共享的核心。制定

2、元数据标准时,通常是重用已有的合适的元数据标准,采用选择、修改或重新定义等方式匹配组合多个元素。但仅采用标准中的元索通常不能完全满足实际需求,还需要自定义一些特殊元素“。医学科学数据的主要特点是数据量巨大、内容繁杂、形式多样、散在分布。因此,深入研究各种已有元数据,制定适用于我国医学数据共享的元数据标准,是完成“医药卫生科学数据管理和共享服务系统”建设任务的关键。本文通过对多种元数据标准的分析和比较,提出制定我国医学元数据标准的基本策略和基本流程。1制定医学元数据标准的基本策略目前,国外医学科研的原始数据在互联网上主要以

3、医学专业数据库和医学专业数据库群的形式共享。在国内,多年来国家和地方政府用公益资金支持的研究项冃,包括科技部历届五年计划的重大疾病攻关项冃、专项资助项目、国际合作研究、全国性大规模各种疾病的调查、诊断治疗规范、多中心临床试验等生成的数据构成了医学科学数据的主体。我国医药卫生科学数据管理和共享服务系统是基础与临床相结合,预防与治疗相结合,中医与西医相结合,普通医学和特种医学相结合的大型、综合、公益性项目。为此,必须密切联系实际,明确制定适合我国国情的医学元数据标准的策略。下面对几种已有的元数据进行分析。1都柏林核心元数据都

4、柏林核心元数据(以下简称De)是元数据的一个标准集——都柏林核心元素集的简称。DC元数据标准是为描述网络资源、支持网络检索而建立的元数据模式,用以提高网络信息资源的开发利用率。De元数据规范是1995年3月由美国俄亥俄大学图书馆中心(OeLC)与美国超级计算机应用中心联合发起,52位来自图书馆界和电脑网络界的专家共同研究制定的。都柏林核心元素集被认为是描述网络资源最少需具备的项目。总共有15个着录元素,分为3个部分:内容描述部分(Title‘subject、Description、s叫rce、、CoveH弹、Type);

5、知识产权部分(creator、Publisher、cont曲utor、;外形描述部分(Date、Fonnat、hnguage、。由于DC具有简易性、语义互用性、国际一致性、灵活性、全面性和可扩展性等特点,因此被广泛用于多个学科领域元数据制定的基础。1.1DC在医学领域中的应用目前,国外应用DC制定的医学元数据主要包括以下几种怛'31:医学元数据的Lifescience,Medicine数据库直接采用De元数据格式和美国国立医学图书馆医学主题词表(MesH)o元数据规范美国国立医学图书馆的元数据规范直接复用的8个元素;将D

6、e的一些限制属性定义为元素;扩展了De的限制属性,并定义为元素;根据医学资源的特点扩展了8个新元素。医学核心元数据为提高医学文献检索的专指度,美国俄勒冈州医学院研究的医学核心元数据项冃(McM)在DC基础上开发了一套元数据及编码规则,并用MesH描述主题。复用了De的15个元素;对部分限制属性进行了限制;增加了两个限制属性;定义了一些自己的规范,如资源类型模式。有35种资源类型和模式。法语健康资源冃录和索引主要包含循证医学资源、教学资源及病人信息和公共健康方面的资源。cIsMeF使用两种标准工具:MesH和De元数据格式

7、。复用了以下种元数据集:(1)DC元数据元素集,用来描述所有有关健康的资源,复用了DC的11个元素,形成了个新元素;(2)IEEEI484学习对象元数据,用来描述教育资源;(3)描述循证医学的元数据,用来对资源内容进行控制;(4)卫生资源发现、描述和评鉴语言元数据集,用来增强资源的透明度、可信度和质量。1.2DC的局限性由于DC最初是为了描述一般网络信息资源而设计的,所以它的15个元素相对较简单,用来描述医学科学数据等复杂、特殊信息对象时则存在一定的局限性。例如,De不能揭示资源间的相互关系;对于资源的安全、确认等考虑不

8、够;采用关键词描述主题对于资源描述相对来说就显得简单有余,而精确不足;在数据质量控制方面,DC没有规定资源描述的依据,不利于保证描述内容的一致性,也带来检索可靠性问题。2地理信息元数据地理空间数据的元数据是地理空间的空间数据和属性数据以外的描述地理信息空间数据集的内容、质量、状态和其他特性的一类数据H]。从历史的角度

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。