欢迎来到天天文库
浏览记录
ID:23826570
大小:70.50 KB
页数:14页
时间:2018-11-11
《引言 现在人们已经进入网络时代,人们查询信息》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、引言现在人们已经进入网络时代,人们查询信息引言 现在人们已经进入网络时代,人们查询信息的手段越来越趋向于网络化,然而网络信息的提供者只注重信息的内容,而忽视了网络信息资源的描述问题。这使得搜索引擎无法提取网络信息资源的核心内容,从而导致查全率和查准率低。一种现象随之产生,即在互联网上总能找到(甚至只能找到)不需要的东西。网络信息资源被准确而合理的描述是其被有效利用的前提和基础,尤其对庞大的网上资源而言。因此,只有对网上的信息资源进行整体上的有效组织、管理和个体上的充分揭示和描述,才能从根本上解决查找、利用上的困难,
2、提高查全率和查准率。但是,网上的信息资源不同于传统的文献资源的各种特点,要求创立有别于传统书目著录组织方式的新工具——元数据,就在这一背景下产生了。 元数据,即关于数据的数据,用来描述网络信息资源、加强对网上信息资源的组织和利用的网络数据集合。而都柏林核心元数据集(DublinCoreElementSet,简称DC)是其中发展比较成熟而又比较成功的一种元数据。DC元数据计划的创建,是通过网络信息资源的提供者对资源属性信息的描述,并对其内容进行编目、定位,来帮助人们尽快地在网上发现所需要的有效信息资源。因此,DC元数据资
3、源描述方案又称为网上资源的编目。 1DC元数据的发展和规范 1995年3月由OCLC(OnlineputerLibraryCenter)和NCSC(NationalCenterforSuperputingApplication)在美国俄亥俄州的都柏林镇联合召开了第一届DC元数据研讨会,目的是寻求一套见解有弹性、非专业图书馆人员也可轻易掌握和使用的信息资源著录格式,以提高网络信息资源的开发利用率。会议结果产生了13个元数据项,因为开会地点在柏林,因此成为柏林核心集,简称DC。1995年至今,OCLC与各有关机构
4、联合举行了8次DC研讨会,每一次研讨会都推出一些具体的研究成果,1996年9月24日~25日,第三届元数据研讨会将原有的13个元数据项扩充为15个,1999年12月22日,经过第七次会议讨论,形成了DC修饰词1.0工作方案,经过几年的研究探讨,DC被译成25种语言,并被许多纳入中,成为描述电子信息的一个部分。因此DC的影响正逐步扩大,有望在不久的将来成为各国都能接受的国际标准[1]。(lw.AsEac.编辑整理) DC是在网络环境中描述文件类对象所需要的最小元素集。其中15个元数据项可以分为[2]: (1)Title
5、:标题项,由资源或出版者给出的被描述资源的名称。 (2)Subject:主题词或关键词项,一般是描述资源的主题和内容的关键词或短语。 (3)Description:描述项,资源的文本描述,包括文献类对象的文摘或视频的内容描述。 (4)Source:项,用来唯一标识被描述资源的。若当前的资源为其原始形式,项元素可以不用。 (5)Language:语言项,被描述资源内容的描述语言。 (6)Relation:关联项,被描述资源与其他资源之间的关系。 (7)Coverage:时空范围项,被描述资源空间或时间特性。空间
6、范围物理区域,来自规范词表的地名或全称。时间范围指资源内容,而不是资源产生的时间(由日期Date元素表示)。时间描述采用与日期Date相同的格式或者采用规范列表中的时间范围描述。 (8)Creator:或者创建者项,对创造资源知识内容负主要责任的个人或机构。 (9)Publisher:出版者项,负责发行被描述资源的组织。 (10)Contributor:其他参与者项,指没有在Creator元素中列出的对被描述资源的创作做出了共献的其他人或组织,其贡献次于创建者。 (11)Rights:版权管理项,被描述资源的版权
7、声明和使用范围。 (12)Date:发布日期项,被描述资源公开发布的日期。 (13)Type:类型项,被描述资源属性的范畴或类型,通常从资源类型列表中选取。 (14)Format:格式项,被描述资源的数据格式,用于注明需要什么软件或硬件来显示和执行这一资源。为了提高互操作性,格式值应该从格式列表中选取。 (15)Identifier:标识项,能够唯一标识描述资源的字符或数字。 这简单的15个元素由于具有可延伸性、可选择性和可重复性等特点,可根据不同行业的需求对其进行改编,达到描述信息的完整性、可靠性和检索效率高
8、的目标。从DC元数据的元素结构及著录规则可以看出有如下特点: (1)结构简单。只有15个基本元素,且根据DC的可选择原则,还可进一步简化著录项目。 (2)通俗易懂。非编目人员根据元素的含义易学易会。制可根据DC的标准标引自己的网页、出版物等,提高标引的质量和效率。 (3)可扩展性。可以与其他元数据如RDF(Re
此文档下载收益归作者所有