数字图书馆元数据方案设计说明书

数字图书馆元数据方案设计说明书

ID:19172665

大小:21.29 KB

页数:12页

时间:2018-09-29

数字图书馆元数据方案设计说明书_第1页
数字图书馆元数据方案设计说明书_第2页
数字图书馆元数据方案设计说明书_第3页
数字图书馆元数据方案设计说明书_第4页
数字图书馆元数据方案设计说明书_第5页
资源描述:

《数字图书馆元数据方案设计说明书》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数字图书馆元数据方案设计说明书  元数据方案就是数字图书馆中所使用的信息描述方法。数字图书馆的运作,无论是存取过程还是检索过程,都是以元数据方案为基础实现的。以下是数字图书馆元数据方案设计说明书,欢迎阅读。  元数据方案为数字图书馆分布式信息资源的发现和检索奠定了基础。因此,元数据方案决定了数字图书馆的功能特征、运行模式和系统运行的总体性能。为了实现这一总体性能,达到共建共享信息资源的目的,数字图书馆元数据方案应遵循下列原则。  元数据方案的标准化原则  在数字图书馆建设中,标准问题最重要的是元数据的制作,而与元数据的制作紧密相关的问题是元数据

2、方案的设计。  然而,目前在元数据方案的标准化方面存在很多问题。首先,就DC系列元数据而言,在同一元素的著录内容上存在较大的差异。如,北京大学拓片元数据要求在权限(Rights)元素中著录馆藏地址、允许使用的用户范围,而在《数字式中文全文文献通用格式》规定著录有关权限管理的声明,包括知识产权等。其次,对于同类型信息资源的组织,有的图书馆已经采用DC元数据,有的则仍然采用MARC元数据。这种著录内容和同类信息资源所用元数据的不一致都会给数据交换的带来困难。最后,各个元数据所采用的编码语言也是各不相同,有的采用HTML,有的采用SGML或XML。由

3、于各个编码语言的标签设置、内容、可扩展性的不同,则会影响元数据的通用性。  元数据方案的标准化原则具有广泛的内涵。它包括元素著录内容的标准化、同类型数字化信息资源的著录所采用元数据的一致性、元数据方案所采用编码语言的统一性这几个方面。  元数据方案的准确性原则  所谓准确性原则一方面指元数据方案中元素的定义、使用的术语等不能模棱两可,容易产生歧义,导致不同的理解;另一方面指元数据方案能够准确地描述信息资源。也就是说,元数据方案不仅要规定元素的设置、著录规则、标记语言的使用,而且要规定著录所依据的标准、传输交换语言等。  当前困扰各个搜索引擎的问

4、题是如何提高其查准率。搜索引擎的低查准率究其原因是其对信息资源特征的揭示不够准确、深入。数字图书馆的信息资源类型多样,既有文字信息,也有音频、视频信息,只有准确地揭示它们的特征,提供高质量的元数据,才能保证较高的查准率。  元数据方案的通用性与专用性原则  元数据方案的通用性与专用性都是相对而言的。所谓通用性是指元数据方案可用于数字图书馆多种信息资源的元数据制作。所谓专用性是指元数据方案只适用于数字图书馆某一特定类型信息资源的元数据制作。具有通用性的元数据适用于组织多种类型的信息资源。通用性元数据有两种:一种通用性元数据的结构非常庞大、复杂,但

5、是具有很好的描述深度,因为所有的情况都已经定义了,比如MARC元数据。另一种通用性元数据,其结构非常简单,好学易用,仅仅只有几个非常普遍的属性,但对特定类型的信息资源的描述能力不够。而具有很好专用性的元数据,其对于某一特定类型的信息资源描述能力很强,但无法覆盖其它类型的信息资源。数字图书馆信息资源类型多样,过分强调专用性会导致多种元数据各自为政。因此,在设计元数据方案时,设计人员需要在通用性和专用性之间加以协调、平衡,才能产生更好的效果。  元素设置的可扩展性原则  所谓元素设置的可扩展性原则是指在元数据方案设计时,为元素、元素的限定词以及属性

6、值的扩充留有一定的余地。数字图书馆要处理的数字化信息资源非常广泛,而且各类数字化信息资源的应用背景更为复杂。如果元数据方案只提供最广泛意义上的描述,一些针对特定应用背景的内容并不纳入,那么,应允许使用者在不破坏已规定的标准内容(如元素的语义定义)的条件下,扩充一些元素或属性值。此外,元数据是一个发展活跃的领域,新的元数据元素会不断出现,老的元数据元素会不断修改完善。数字图书馆的生存环境是一个不断变化的环境,新的信息源也会层出不穷。这就要求元数据方案允许将新的元数据元素容纳于其中,或者要求修改更新已经注册的元数据方案。  元数据方案的互操作性原则

7、  所谓元数据方案的互操作性,是指在由不同的组织制定与管理且技术规范不尽相同的元数据环境下,要向用户提供一个统一的数据检索界面,确保系统对用户的一致性服务。在具体应用上,互操作性表现为易转换性,即在所携信息损失最小的前提下,可方便地转换为其它系统常用的元数据。  非MARC元数据与数字图书馆信息资源组织的质量问题  在此,根据我国当前引进、研制元数据的状况,将现存的元数据分为两类,即MARC元数据和非MARC元数据。MARC元数据包括USMARC、UNIMARC、CNMARC等。非MARC元数据包括DC系列元数据和非DC系列元数据。DC系列元数

8、据是指我国在数字图书馆建设的过程中,对DC元数据加以引进并改造而生成的针对特殊类型信息资源的元数据,也就是说这些新出现的元数据是在DC元数据的基础上进

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。