欢迎来到天天文库
浏览记录
ID:33000769
大小:55.81 KB
页数:3页
时间:2019-02-18
《元数据与网络信息资源引论》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、元数据与网络信息资源引论1.1元数据的基础理论网络信息资源呈现出动态性、分布性、多元性和无序性的特点。但综观网络信息资源现状,目前存在着严重的不规范、不准确、不开放等问题。因此如何制定和实施一系列准确、规范而且互操作性强的网络信息资源描述格式和组织系统成为一个重要的研究领域,并促成了元数据(metadata)的发展。元数据是关于数据的数据⑴。一般分为描述性元数据、结构性元数据以及管理型元数据。本章重点对前两种元数据作归纳和分析。1.1.1描述性元数据搜索引擎之所以具有强大的检索功能,就在于它可以对网站实施“地毯式”搜寻。搜索引擎在帮助用户寻找所需信息方面发挥了重要作用,但在返
2、回搜索结果时候却不能满足用户需求。原因就是信息资源的提供者只重视信息资源的内容,而忽略了信息资源的描述。正是在这种背景下,产生了描述性元数据。描述性元数据的典型代表是都柏林核心元素集(DublinCoreElementSet,简称DC)。1.1.2结构性元数据结构性元数据就好比文献著录中的著录格式⑵。结构性元数据也称置标语(MarkupLanguage),因为它们用来定义各种播述性元数据的句法结构。置标语言根据其用途可分格式化置标语言(FormattedMarkupLan2guage)、专用置标语言(SpecificMarkupLanguage)、通用置标语言三种(Speci
3、ficMarkupLanguage)。随着网络的快速发展,面对新的复杂的应用需求。万维网协会(WorldWideWebConsortium,简称W3C)于1998年2月推!JLi了可扩展置标语言(ExtensibleMarkupLanguage,简称XML)。需要指出的是:(1)基于XML的元数据本身也有一个不断发展的过程。(2)RDF是XML的一个实际应用,它为元数据的编码、交换、计算机处理提供了一个统一的语法架构,使目前网上种类繁多的元数据格式可以使用同样的结构,方便了互相之间的转换和交流。鉴于W3C的影响,RDF极有可能成为未来元数据的标准架构。1.2元数据在网络信息资
4、源中的应用1.2.1网络信息资源需要有效利用我们现在牛活在一个信息爆炸的时代,网络信息资源呈几何指数递增,如何从浩如烟海的网络信息资源中准确、全面地找到用户所需要的信息是目前网络信息资源利用中急需解决的问题。信息组织是网络信息资源有效利用的一个重要环节。只有经过良好组织的网络信息资源,才能更好地被人们查找和利用。1.2.2网络信息资源组织方式和要求网络信息资源组织:是利用一定的规则和方法,通过对网络信息资源外在特征和内容特征的表达和归序。实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用。1.2.3元数据的作用元数据在网络信息资源组织方面的作用⑶(1)描述(
5、Description)根据元数据的定义,它最基木的功能就在于对信息对象的内容和位置进行描述,从而为信息对象的存取与利用奠定必要的基础。(2)定位(localization)由于网络信息资源没有具体的实体存在,因此,明确它的定位至关重要。元数据包含有关网络信息资源位置方面的信息,因而由此便可确定资源的位置之所在,促进了网络环境中信息对象的发现和检索。此外,在信息对象的元数据确定以后,信息对象在数据库或其它集合体中的位置也就确定了,这是定位的另一层含义。(3)搜寻(Discovery)元数据提供搜寻的慕础,在著录的过程中,将信息对彖屮的重要信息抽出并加以组织,赋予语意,并建立关
6、系,使检索结果更加准确,从而有利于用户识别资源的价值,发现其真正需要的资源。(4)评估(evaluation)元数据提供有关信息对象的名称、内容、年代、格式、制作者等基本属性,使用户在无需浏览信息对象本身的情况下,就能够对信息对象具备基本了解和认识,参照有关标准即可对其价值进行必要的评估,作为存取与利用的参考。(5)选择(Selection)根据元数据所提供的描述信息,参照相应的评估标准,结合使用环境,用户便能够做出对信息对象取舍的决定,选择适合用户使用的资源。元数据在网络信息检索方面的作用:(1)管理大量低带宽网络的数据。(2)支持有效的网络信息资源的发现和检索。(3)标准
7、的元数据描述允许比较、分享、集成和再利用不同类型的数据。(4)元数据起到了看门人的作用,具有商业化信息资源不可缺少的作用。1.2.4网络信息资源检索中存在的问题目前网络信息资源检索的主要工具就是搜索引擎,它们大多采用基于因特网站点内容的全文标引方法,这已不是网络信息资源检索的最佳方法,结果是出现大量无用信息,甚至没有真正需要的信息。网络环境下信息资源组织呈现许多新的特点®(1)信息数量大,种类繁多;(2)内容丰富且分布不均;(3)组织无序,随机变化,时效性强。而元数据的正是用于帮助识别、描述和定位Int
此文档下载收益归作者所有