大数据时代背景下基于云计算的未来图书馆数字信息资源建设

大数据时代背景下基于云计算的未来图书馆数字信息资源建设

ID:10141509

大小:31.00 KB

页数:9页

时间:2018-06-11

大数据时代背景下基于云计算的未来图书馆数字信息资源建设_第1页
大数据时代背景下基于云计算的未来图书馆数字信息资源建设_第2页
大数据时代背景下基于云计算的未来图书馆数字信息资源建设_第3页
大数据时代背景下基于云计算的未来图书馆数字信息资源建设_第4页
大数据时代背景下基于云计算的未来图书馆数字信息资源建设_第5页
资源描述:

《大数据时代背景下基于云计算的未来图书馆数字信息资源建设》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大数据时代背景下基于云计算的未来图书馆数字信息资源建设  摘要:大数据时代的到来为图书馆服务提出了挑战,图书馆的传统业务受到冲击和压力,在大数据环境下使用云计算技术发展业务将成为图书馆未来的发展趋势。本文介绍了大数据和云计算的概念和特性,阐述了现阶段图书馆信息资源建设所面临的问题,分析了云计算在未来图书馆信息资源建设中的应用,最后探讨了云计算在数字图书馆中应用需注意的问题。关键词:大数据;云计算;图书馆;信息资源建设1大数据1.1“大数据”的含义和分类大数据之所以被称为大数据首先因为它的数据是海量的,而且目前随着科技发展,随

2、着人们对互联网的依赖程度不断提高,这个海量的数据正在超速增长。其次,大数据是海量的数据被整理纳入大数据仓库里,然后对其进行分析挖掘,再利用有价值的结论进行下一步行动的决策[1]。9大数据从数据内容结构上可分为结构化数据、半结构化数据和非结构化数据。结构化数据即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据,在形式上有诸如文字、数字、符号,能够用统一的形式加以标识。非结构化数据包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像、音频和视频信息等等,这些内容无法用简单的逻辑表达实现,分析起来也需要

3、特别的硬软件。半结构化数据,就是介于结构化数据和非结构化数据之间的数据,它一般是自描述的,数据的结构和内容混在一起,没有明显的区分。1.2图书馆的”大数据”图书馆的大数据首先包括书目数据。这些数据一般属于图书馆稳定的结构化数据,目前这些数据的使用多用SQL工具分析。对于结构化的数据,小规模的数据,目前的分析工具足可以用了。对这些数字化书目数据做分析可以反映出一个图书馆馆藏的级别、服务的对象、服务的倾向和服务的质量。图书馆的大数据虽然以结构化数据为主,但随着图书馆新服务的开展,图书馆与读者的互动信息,以及读者面对图书馆的各种信

4、息行为都会被记录,这些信息将成为图书馆大数据中的非结构化数据。这些动态的非结构化数据可以来自图书馆业务内容,也可以来自读者服务体验。2云计算2.1云计算的概念云计算是并行计算(ParallelComputing)、分布式计算(DistributedComputing)和网格计算(GridComputing)以及Internet9结合起来的新的网络资源提供模式。云计算是以虚拟化技术为基础,以网络为载体,以提供基础架构、软件、平台等服务为形式,整合大规模可扩展的计算、数据、存储、应用等分布式计算资源,进行协同工作的超级计算模式[

5、2]。它不仅是资源的简单汇集,而且为我们提供了一种管理机制,让整个体系作为一个虚拟的资源池对外提供服务,并赋予开发者透明获取资源、使用资源的自由。2.2云计算的特点2.2.1超强的计算能力云计算由成千上万台服务器组成的集群能赋予用户前所未有的能力。用户可以拥有超大的存储和管理空间,以及超强的计算能力。2.2.2海量的存储空间云计算为数据的存储提供了广阔的空间,它是将大量的服务器集群共同组合在一起,形成巨大的空间,所有的数据通过云计算中心运算处理后返回给用户。2.2.3可靠的安全保障云计算使用了数据多副本容错、计算节点同构可互

6、换等措施来保障服务,存储在云里的数据资源丢失或硬件崩溃都不会受到影响,云计算技术存储数据安全可靠。2.2.4便利的资源共享9由于是将大量的信息汇聚成一个整体,对于同一资源可以供多方共同使用,从而避免了资源不必要的重复,进而提高了信息资源的共享程度。同时,云计算可以针对不同应用即时应对,规模可以动态伸缩,云计算下的资源可以根据应用和用户规模增长的需要随时进行动态扩展和配置。2.2.5良好的系统兼容对于不同的操作系统,不同的数据格式,不同的数据库之间的数据,云计算可以通过一站式检索不同系统中的相同信息,系统之间可以无缝连接和访问

7、。3现阶段图书馆信息资源建设面临的问题图书馆的数字资源包括图书馆引进或自建的,拥有磁、光介质或网络使用权的数字形态的文献资源。根据数字资源的种类可分为:电子书、电子刊、二次文献数据库和其他数据库。根据数字资源的存在形式可分为:在线资源和本地镜像资源。根据数字资源的来源可分为:购买的数据库、自建数据库、试用数据库和免费数据库[3]。现阶段图书馆都是各自为政,在建设的过程中存在着很多问题。3.1数字资源重复建设问题目前,馆与馆之间数字资源的建设都是相互独立的,在建设过程中都是按照学校经费多少和专业的需求进行资源建设,一般都不会考

8、虑其他馆的建设情况,只埋头建设自己的数字资源。这样势必造成了大量的人力、财力的浪费,从宏观的角度看不利于高校图书馆的发展。3.2存储及检索技术问题9随着数字图书馆的发展,图书馆的数字资源海量增加,而其数据管理、备份、存储设备能力都十分有限。同时,数字资源的图片检索技术、多语言检索、不同数据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。