欢迎来到天天文库
浏览记录
ID:55272894
大小:227.41 KB
页数:3页
时间:2020-05-12
《大数据时代的高校图书馆数字资源建设研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第31卷第3期甘肃科技Vo1.31No.32015年2月GansuScienceandTechnologyFch.2015大数据时代的高校图书馆数字资源建设研究秦小华(陇东学院图书馆.甘肃庆阳745000)摘要:大数据不仅仅是数据量的剧增或者信息技术的飞跃,而可能是人类对客观世界认知飞跃的前奏。本研究通过分析大数据的概念、特点以及大数据给高校图书馆数字资源建设带来的新要求,探索了大数据时代高校图书馆数字资源建设的应对策略。关键词:大数据;高校图书馆;数字资源;资源建设中图分类号:G258随着物联网、云计算
2、、电子商务等技术的深人别、出生年月等,而且这些元素之问有关联性。大数发展.互联网上数以亿记的用户时刻在产生着巨量据既包括数字和文字,还包括图片、音频、视频、链的交互数据.移动终端、无线传感器、RFID等设备无接等半结构甚至非结构化的数据.这些元素之间没所不在.这些设备每分每秒都在产生数据,金融、交有事先定义的关联性。在处理技术上,大数据需要通、通信等行业的数据量很大,而且与日俱增,其同时处理数字、文字、视频、图片等非结构化数据,实.全球的信息量以每年至少59%的速度剧烈激数据量可以达到PB级甚至于更高.而
3、传统数据一增.据互联网数据中心IDC预测.到2020年世界上般是数字和文字等结构化内容.数据量比较小.一的数据存储总量将达到35ZB(相当于般在TB级以下大数据不仅表示数据的量大.还涵35000000PB)。是2010年的30倍。而且这些数据盖了数据处理的速度不仅包含数字和文字等结构化数据.还包括图片、1.2大数据的特点音频、视频、链接等半结构化数据甚至非结构化数关于大数据的特点.相关学者提出过很多种说据根据互联网中心的数据判断,目前非结构化数法.比较具有代表性的是2001年Gartner研究副总据占全球
4、数据总量的80%以上。由此可见,人类已裁DougLaney最早提出的“3V”模型(即数量大Vo1一经步人大数据时代。ume、速度大Velocity和种类多Variety)。之后,好多学者还在3v的基础上增加了第四个特征.但关于1大数据的概念及特点第四个“V”的说法也很多,IBM认为.大数据应该还1.1大数据的概念具有真实性(即Veracitv),而IDC认为应该具有价2011年5月.全球最著名的管理咨询公司麦肯值性(即Value),相较于传统数据,大数据的价值呈锡(MckinseYandC0mpanv)发
5、布了关于大数据的研现出稀疏性的特点。如今。业内人士已经将大数据究报告《大数据:创新、竞争和生产力的下一个前沿的特点扩展到了11个V,包括可见性、有效性等,但领域》,在报告中提出了大数据的概念,他认为大数各行业比较认可的说法还是“4V”模型特征。据是指无法在一定时间内用传统数据库软件工具1.2.1数据量大对其内容进行抓取、管理和处理的数据集合。其实,截至目前.人类生产的所有印刷材料的数据总从字面意思理解.大数据就是大量数据的集合,但量是200PB(1PB=210TB)。而历史上全人类数据总是.这里所说的大数
6、据与传统的数据有着存储形式量约是5EB(1EB-210PB)。据IDC预测。到2020年和处理技术上的不同.传统的数据主要包括数字和世界上的数据存储总量将达到35ZB(相当于文字.这些数据一般存储在数据库中,并被定义好35000000PB),相当于2010年的3O倍。当前。典型一定的结构.且个数据元素之间具有关联性.比如个人PC硬盘的容量为TB级.而一些大企业的数据对于某个用户的信息。一般会定义他的ID、姓名、性量已经接近EB两级。由此可见。大数据时代的数据第3期秦小华:大数据时代的高校图书馆数字资源建设
7、研究81体积是巨大的视频、音频、链接、程序以及读者的各类信息等多种1.2.2数据种类多类型.如此复杂的海量数据势必会产生很大的数据大数据时代的数据除了文本、数字等结构化数冗余。只有简化复杂环境下的数据处理过程,才能据外,更多的是图像、视频、音频、链接、地理位置信及时挖掘出其中蕴含的有用信息,因此,必须采用息等半结构化甚至于非结构化的数据.如此种类繁一种特别高效的数据计算方式传统的数据备份方多的资源也激发了大学生移动学习的动机.但是面式需要特定的设备.不仅复杂而且耗费资源.大数对如此繁多的数据种类和复杂的数
8、据结构.需要的据时代的高校图书馆亟待开发出适合的备份容灾是更强大的数据处理能力产品。1.2.3数据处理速度快2.3数据安全和用户隐私存在问题数据处理速度快是大数据区别于传统数据挖大数据时代.海量的数据通过云计算的分布式掘的最显著特征。从种类繁多、体积巨大、结构复杂存储方法分散到各个“云”中.用户的动态性、云计的海量数据中挖掘出有价值的信息.势必需要极大算的复杂性以及数据的变化性可能会给黑客留下的数据处理速度。对于通信、银行等企
此文档下载收益归作者所有