面向大数据时代图书馆知识服务

面向大数据时代图书馆知识服务

ID:6053247

大小:47.00 KB

页数:20页

时间:2018-01-01

面向大数据时代图书馆知识服务_第1页
面向大数据时代图书馆知识服务_第2页
面向大数据时代图书馆知识服务_第3页
面向大数据时代图书馆知识服务_第4页
面向大数据时代图书馆知识服务_第5页
资源描述:

《面向大数据时代图书馆知识服务》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、面向大数据时代图书馆知识服务  〔摘要〕本文简述了大数据的基本概念、特点、处理流程和处理模式,探讨了在大数据时代,图书馆将在数据集成、数据分析和数据隐私问题等方面面临着巨大的挑战与考验,最后,提出了大数据时代图书馆如何利用大数据技术在知识服务方面进行创新,从而提高图书馆的核心竞争力,以应对未来可能面临的生存危机。〔关键词〕大数据;知识服务;个性化DOI:10.3969/j.issn.1008-0821.2013.10.007〔中图分类号〕G250〔文献标识码〕A〔文章编号〕1008-0821(2013)10-0033-05随着云计算、物

2、联网等技术的兴起,以及博客、微博、社交网络和基于位置的服务LBS(locationbasedservice)等新型信息发布方式的不断涌现,再有极其微小带有处理功能的传感器广泛布置于社会的各个角落,监控整个社会的运转,新数据源源不断的从这些设备自动的产生,今天数据的增长速度前所未有,随着数据的迅速增长和累积,大数据时代已经来到,社会各界都已经开始密切关注大数据问题,并对其产生浓厚的兴趣。如:学术界,早在2008年《Nature》就推出了Big20Data专刊[1];IT业界,全球知名的咨询公司麦肯锡(McKinsey)2011年6月份发布

3、了一份关于大数据的详尽报告“Bigdata:Thenextfrontierforinnovation,competition,andproductivity”[2],对大数据的相关问题进行了详尽的分析。进入2012年,人们对大数据的关注更是与日俱增。2012年3月份美国奥巴马政府发布了“大数据研究和发展倡议”[3](Bigdataresearchanddevelopmentinitiative),正式启动“大数据发展计划”。计划利用大数据技术在科学研究、环境、生物医学等领域进行突破。2012年5月联合国一个名为“GlobalPulse”

4、的倡议项目也发布报告[4],对大数据的应用进行初步的解读,并阐述各国特别是发展中国家在大数据时代面临数据洪流(datadeluge)时所遇到的机遇与挑战。同时,媒体也发文宣传介绍大数据,如《纽约时报》的文章“Theageofbigdata”[5],使普通民众开始意识到大数据的存在及可能产生的影响。1大数据1.1大数据的基本概念和特征20大数据的概念本身比较抽象,目前尚未有一个公认的定义,维基百科的定义则简单明了[6]:大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。在大数据的定义问题上,一般从对大数据特征的

5、阐述和归纳上给出定义,如认为大数据有4个特点的4V定义[7-9]:(1)从体量(Volume)上,数据规模庞大;(2)从类型(Variety)上,模态繁多,结构化、半结构化、非结构化三者融合,并且半结构化和非结构化数据所占份额越来越大而且在相当长的时期内非结构化数据会占据大数据的主体;(3)从时速(Velocity)上,生成快速,其主要特征是数据的快速和实时化;(4)从价值(Value)上,价值巨大但密度很低,大数据的价值往往呈现出稀疏性的特点。大数据除上述4V定义阐述和归纳的特征外,还应具有如下特征:首先在数据模式(schema)和数

6、据的关系上,不同于传统的数据库都是先有模式,然后才产生数据,而是先有数据而后才能确定模式,且模式随着数据量的增长处于不断的演变之中;再者在处理对象上,对大数据我们需要从根本上转变思维,大数据不仅是数据处理的对象,更是一种基础资源,我们可用数据这种基础资源来协同解决其他诸多领域的问题。图灵奖获得者、著名数据库专家JimGray博士提出了一种新的被他自己称之为“第4种范式”(TheFourthParadigm)的数据探索型科学研究方式[10],第4种范式的实质就是数据思维,从以计算为中心转变到以数据处理为中心,采用第4种范式来作指导的典型的

7、科学研究领域,如:计算社会科学(computationalsocialscience)[11]。1.2大数据的处理流程和处理模式20数据收集的根本目的是根据需求从数据中提取有用的知识,并将其应用到具体的领域之中,大数据的出现必将颠覆传统的数据管理方式。大数据的数据来源广泛、应用需求和数据类型都不尽相同,但是最基本的处理流程是一致的。整个大数据的处理流程可以定义为在合适工具的辅助下,首先对广泛异构的数据源进行抽取和集成,按照一定的标准将结果统一存储,然后利用合适的数据分析技术对存储的数据进行分析,从中提取有益的知识,最后将结果以恰当的方式

8、展现给终端用户。具体来说可以分为数据抽取与集成、数据分析以及数据解释[12]。主要处理模式可以分为流处理(streamprocessing)和批处理(batchprocessing)两种[13-14]。批处

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。