欢迎来到天天文库
浏览记录
ID:8825698
大小:21.73 KB
页数:4页
时间:2018-04-08
《大数据时代的图书馆》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、大数据时代的图书馆北京联合大学杨宗琳2013.3与云时代息息相关的“大数据”是指互联网用户网络行为数据。“互联网上一天”的数据可以刻满1.68亿张DVD;发出的邮件有2940亿封之多,每天卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……。截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。2009年的数据量为0.8ZB,2010年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数
2、据。而到2012年为止,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB。整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。我国当然也进入了大数据时代。目前,我国互联网大型服务器已达370万台,全国建立了45万个以上数据中心,数据中心总耗电量达到364亿千瓦小时,高达全国电力消耗的1%。在大数据时代,图书馆将在数据存储、数据挖掘、数据分析等方面面临巨大挑战,复杂数据的处理也将成为图书馆发展的主旋律,通过大量的非结构化数据、半结构化数据去寻找
3、隐藏在数据背后的世界,进而为图书馆服务的模式、对未来发展趋势提供分析与预测将成为大数据时代图书馆的一大主要服务内容。图书馆将进入由藏书楼、阅览室到使用网线解决人们阅读需求的数字图书馆时代,读者通过手机等移动终端可以访问数字图书馆,查询世界、国家和各省、市级数字图书馆的资源。未来时代将是大数据引领科技发展的时代,大数据技术应用将是未来图书馆服务创新的重要领域。本文讨论在大数据时代的图书馆,如何与时俱进提升管理与服务水平。1.大数据时代图书馆特点资源数字化、服务网络化、管理知识化是大数据时代图书馆的主要特点,换言之,图书馆从图书的保管者成为面向服务的信
4、息提供者,从单一纸媒体到多媒体,从本馆收藏到无边界图书馆,从我们到图书馆去到图书馆来到我们中间,从按时提供到及时提供,从馆内处理到外包处理,从区域服务到国际服务。 大数据时代的图书馆就是数字图书馆。2.数字图书馆数字图书馆必须利用高端服务器、网络通信技术、智能存储系统、将面向对象的软件技术、人工智能技术与先进的知识组织和调度系统相结合,建立具有很好的可扩展性、易用性、可管理性和高可用性以及较强的可持续发展能力的数字图书馆系统和群体。 传统图书馆技术核心是图书分类技术、编目技术、标引技术,数字图书馆技术核心是数字存储技术、数字检索技术、网络安全技术、
5、信息集成技术、系统互操作技术。数字图书馆的管理基本职能主要是信息资源管理和人力资源管理,使馆员、资源、读者三者关系和谐发展。传统图书馆提供书库平台,完成静态的、被动的服务,主要是为读者找书和为书找读者;数字图书馆则提供网络平台和信息产品,完成动态的、主动的服务,通过网络按需供给。无疑,图书馆要从实际出发,循序渐进,加强传统技术与现代技术的融合,向数字化迈进。 1.图书馆馆藏资源数字化图书馆系统包括馆员、馆藏资源、信息技术、环境、用户…。大数据新信息环境的形成,使图书馆行业与其它信息服务行业的界面日渐模糊。调查发现,84%的用户使用搜索引擎Googl
6、e开始信息检索,1%的人从图书馆网页上开始信息的检索。图书馆应该为这1%用户提供数字化馆藏资源供使用。图书馆馆藏包括实体印刷馆藏和数字馆藏,数字馆藏包括实体数字馆藏和虚拟数字馆藏。 调查发现,这1%用户中70%以上的读者首先选择利用数字馆藏;数字馆藏提供或满足读者的70%以上的服务;利用率最高的资源,70%以上是馆藏中的数字资源。 数字馆藏评价包括科学性、经济性和可获取性。需要考虑: (1)选择什么样的模式存放数据; (2)选择什么样的方式组织信息; (3)选择什么样的策略供读者访问; (4)选择什么样的思路保证馆藏的可持续发展。数字馆藏制作流程包
7、括:元数据的标准和规范、知识资源(含声、像、图、文)的通用型加工系统、语法层次的大容量文献自动采集、自动篇名生成、自动标引、自动文摘生成的实用化技术、知识概念(语义)体系的建立、实现语义层次的自动标引、自动文摘生成、分布式藏品元数据的聚集与元数据库的构建、超大规模多媒体数字资源的长久保存、归档和存储管理技术,包括档案系统等、数字内容藏品的版权管理系统、数字对象和媒体的新型经济与商务模型研究、与创建和使用数字收藏有关的社会经济法律问题的技术、方法、过程。 1.图书馆服务网络化数字图书馆的建设以不断改善用户服务为最终目标,必须为用户在知识发现与利用上提
8、供高效方便的工具,并且使得用户可方便地透过数字图书馆的多个资源库无缝获取所需的知识。服务的核心技术就是网络化。 网络化包括
此文档下载收益归作者所有