作为关联开放数据的德国国家书目应用与机遇-ifla

作为关联开放数据的德国国家书目应用与机遇-ifla

ID:32359917

大小:527.34 KB

页数:13页

时间:2019-02-03

作为关联开放数据的德国国家书目应用与机遇-ifla_第1页
作为关联开放数据的德国国家书目应用与机遇-ifla_第2页
作为关联开放数据的德国国家书目应用与机遇-ifla_第3页
作为关联开放数据的德国国家书目应用与机遇-ifla_第4页
作为关联开放数据的德国国家书目应用与机遇-ifla_第5页
资源描述:

《作为关联开放数据的德国国家书目应用与机遇-ifla》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、http://conference.ifla.org/ifla78Datesubmitted:2July2012作为关联开放数据的德国国家书目:应用与机遇JürgenKettSarahBeyerMathiasManeckeYvonneJahns&LarsG.SvenssonDeutscheNationalbibliothekFrankfurtamMain,Germany中文翻译:赵梦(中国国家图书馆)ChineseTranslator:ZHAOMengNationalLibraryofChinaSession:215—Whatisanatio

2、nalbibliographytodayandwhatareitspotentialuses?—Bibliography摘要本文探讨了21世纪对国家书目的要求。作者认为,除了传统标准数据所要求的完整性、可靠性,数据的现时性,可参照性和永久保存性外,国家书目还需要增加一项要求,即国家书目需要将其自身整合进万维网,因为在今天万维网才是信息交换的场所。要实现这一点,就需要应用关联数据技术在开放协议下并实现数据公开。作为一个案例,我们研究了德国国家图书馆的做法。其数据库中大约70%的内容都已经作为关联数据得以公开。导言1国家书目可以被定义为某一地理限

3、定区域出版物的完整列表。在万维网时代,我们应当进一步拓展这一定义,因为万维网既改变了“出版物”的意义,也改变了我们出版的方式。传统纸质印刷书是独立的、静止的,而万维网出版物没有很好的范围界定,它是动态的、互动的,内容千变万化的。进一步说,用以记录文本的技术手段已经发生变化:随着全文检索成为可能,元数据目录,叙词表和分类体系的使用正逐渐被边缘化。这并非是因为全文检索优于基于元数据的检索,而是因为它更便于自动化操作:我们可以轻而易举地在网页上找到全文资1参看Anderson(1974)p.121源,然而,高质量的元数据需要被生成。元数据的创建或编

4、目,要么需要复杂的自动化程序,要么需要人工介入。但是,现在大多数由人工完成的过程都是在图书馆之外完成的:出版商使用自己的元数据来提高其自身的可见性,在线平台,诸如维基百科或开放图书馆则广邀普通大众发表文章并来用元数据描述这些发表的文章,这样就成为全文检索的完美补充。近期大规模数字化和OCR的广泛兴起,在先前没有数字化的资料中开放全文检索成为了可能,都使这一情形得到了很大改善。对于像Google这样的搜索引擎公司来说,这样显然比使用传统的编目方法更有效率-在2他们的搜索引擎中,基于元数据的检索仅仅被视为一种补充方式。在这样的背景下,图书馆需要自

5、问,在当下和未来,在传统编目之上构建的国家书目可以传递哪些附加价值。对国家书目的要求传统意义上,国家书目是以出版商或图书销售、图书馆和终端用户(特别是研究者和文学学者)这三组不同对象为目标的。这三组对象有着一定的共同点,即,他们都是建立在以下四个国家书目的特性之上的:1)数据的完整性和可靠性对于书商、出版商和研究者来说,国家书目要记录所有的出版物(专业性的书目),不能有任何政治或内容上的偏见,这曾是且仍将是必需的。而且,对于编目规则的遵循扮演了关键角色,特别是在数据积累过程中。2)数据的现时性特别是对于图书馆销售和图书馆来说,国家书目中的数据

6、现时性显现得格外重要。20世纪后半期,为了应对出版物数量的急剧增长,缩短出版周期,我们在数据加工上花费了大量的精力。3)可参考性具有完整性、可靠性和现时性几个特点的国家书目便可以作为科研目的的参考点:如果一本书在国家书目中列出,那么我们就可以确认它的存在,反之,如果一本书并没有在国家书目中列出,那么很有可能的情况就是该书从未出版。4)数据的永久保存为了作为引文参考点,书目记录仅仅是遵从上述质量标准还是不够的,还需具备数据永久保存性。直到21世纪初,这还不是个问题,因为书目本身以印刷本的形式出版。只有在积累的书目中修改不合适的条目,但是除此之外

7、没有方法删除一本书已被出版的证据。未来国家书目要求需要进一步估量其自身在万维网中的应用与复用。2参看http://books.google.com/intl/en/googlebooks/about.html23万维网越来越变成信息交换的开放空间:就是所谓的关联数据云。自2008年来,相互关联的数据集的集合在规模上增长巨大,但是人们对于数据质量和数据永久保存的却知之甚少。为了让语义网起作用,我们需要一定水平的信息可靠性,这种可靠性既要考虑信息质量问题又要特别注意信息永久保存的问题。如果知道我们今天所标注的信息在下周就会唾手可得地被引4用,那么

8、这一网络便可以持续地发展壮大。这种情形尤其应用于在线出版物及它们的元数据中。为了确保信息的长久可靠性,我们必须保证这部分万维网的稳定性,而这将可能成为图书馆和其他文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。