欢迎来到天天文库
浏览记录
ID:26954932
大小:50.50 KB
页数:5页
时间:2018-11-30
《档案大数据定义与内涵解析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、档案大数据定义与内涵解析摘要:结合大数据和档案工作实际,定义档案大数据是与档案活动密切相关的各种有价值的、难以在可接受时间内分析处理的数据集。档案大数据来源于三个方面,具有4V+1C及时滞性、获取困难等特征,其实质代表了档案领域一种新的数据生成、存在和处理样态。中国4/vie 关键词:档案大数据;定义;内涵 随着大数据的影响日益广泛,近几年档案界掀起了研究大数据的热潮。“档案大数据”一词频频出现在人们的视野,但迄今为止却很少有人对其定义和含意展开深入探讨,以至于在对档案大数据的理解中“存在着不同程度的概念泛化、夸大与误读。”[1]当前,大数据在档案
2、领域正由概念论说向尝试应用阶段演进,迫切需要对档案大数据给出一个较为明确、科学的定义。鉴于此,本文在梳理已有论点的基础上,结合大数据的涵义,对档案大数据的定义和内涵进行阐释,希望有助于业界更科学地认识该问题。 1档案大数据定义的界定 受大数据浪潮的冲击,自2012年起,国内就有档案学者开始了对档案大数据的研究。但他们大多是从大数据的角度出发,探讨大数据对档案和档案工作的外围影响及其对策等。对于什么是档案大数据,很多人采取了模糊化处理的做法,只有高茂科和鲁德武两位学者专门厘析了其定义。高茂科采取直接套用大数据定义的做法,着重强调数据的规模。他指出,档
3、案大数据就是档案方面涉及的资料量规模巨大到无法通过目前主流软件工具在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的信息。[2]鲁德武则以档案大数据所属范畴为基点,将档案大数据定义为档案中的大数据,即一定空间与时间范围内所有档案数据的集合。[3] 以上两位学者采用“属+种差”的方法,分别从不同的侧面揭示了档案大数据的特征,但这两个定义都存在一定的问题。高茂科的定义把信息作为档案大数据的属概念,将档案大数据的外延等同于信息的外延,并且将档案大数据的应用范畴局限于企业经营决策方面,不仅违背了普通逻辑学中“定义项和被定义项的外延必须相同
4、”的规则,而且窄化了档案大数据的内涵。鲁德武的定义以数据在时间和空间上的全面性来界定档案大数据,突出了档案大数据的整体性特征,但他将档案数据的集合等同于档案大数据,显然没有准确地把握档案大数据的本质属性。同时,“全面性”固然是档案大数据的一个重要特征,但其也不能完整地反映档案大数据的全部意涵。因此,还需要对档案大数据进行更周密的分析。 从词源上来看,档案大数据是由档案和大数据交叉而来的一个概念,它由档案和大数据两方面构成,所以要正确定义档案大数据,关键是要厘清“档案”和“大数据”这两个词在其中的涵义。而从字面上理解,此处的“档案”显然是一个限定词,其
5、基本作用是将后面的“大数据”限定在“与档案直接有关的”这个范畴。 至于何谓大数据,由于其目前尚处于被认识和应用的初级阶段,人们对大数据的理解还存在较大分歧,并没有就其定义达成一致意见,但通过文献梳理发现,大多数研究者倾向于从数据属性和技术层面来界定大数据。麦肯锡公司认为,数据规模超出传统数据库管理软件的获取、存储、管理以及分析能力的数据集就是大数据。维基百科指出,大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间限制的数据集。研究机构Gartner对大数据的定义是:需要新处理模式才能增强决策力、洞察发现力和流程优化能力的海量、高增长
6、率和多样化的信息资产。徐宗本院士则将大数据定义为不能够集中存储、并且难以在可接受时间内分析处理,其中个体或部分数据呈现低价值性而数据整体呈现高价值的海量复杂数据集。[4]纵观这些定义,虽然各自对大数据的认知角度和侧重点不大相同,但它们却蕴含着一个共同点,即都认为大数据的核心是一种数据集,与传统的数据及处理技术相比,其具有数据体量大(Volume)、数据类型多(Variety)、价值密度低(Value)、处理速度快(Velocity)和复杂性(plexity)特征。 作为数据管理理论和实践的新发展,大数据开启了一次重大的时代转型,对包括政府、教育、经济
7、、科技、医疗等在内的各个领域产生了深远影响。随着大数据技术与档案工作的交汇融合不断加深,来自档案层面及其业务活动的数据在数量、速率与种类上急剧且持续扩大,远远超出了传统数据处理软件和技术的能力范畴,由此导致档案大数据迅速兴起。因此可以认为,档案大数据指的就是将大数据技术和理念应用于档案业务领域产生的大数据。综合前文有关大数据的定义,我们对档案大数据作如下界定:档案大数据乃是在档案业务活动(包括档案产生、管理及利用活动)中形成,跟档案及档案业务活动密切相关的各种有价值的、难以在可接受时间内分析处理的数据集。 2档案大数据内涵的阐释 基于上述定义,可以
8、从以下几方面来认识档案大数据。 2.1档案大数据的来源。由于档案大数据是伴随着档案业务活动与
此文档下载收益归作者所有