大数据时代档案数字资源整合的难点及对策分析

大数据时代档案数字资源整合的难点及对策分析

ID:8535162

大小:18.28 KB

页数:4页

时间:2018-03-31

大数据时代档案数字资源整合的难点及对策分析_第1页
大数据时代档案数字资源整合的难点及对策分析_第2页
大数据时代档案数字资源整合的难点及对策分析_第3页
大数据时代档案数字资源整合的难点及对策分析_第4页
资源描述:

《大数据时代档案数字资源整合的难点及对策分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、AnalysisonDifficultiesandCountermeasuresofDigitalArchiveResourcesIntegrationintheEraofBigData大数据时代档案数字资源整合的难点及对策分析文/孟歆MengXin摘要:在大数据背景下,档案数字资源具有数量庞大、增长迅速、多源异构等新特点,因此对其进行资源整合就要解决数据存储、数据分析、安全隐私、人才紧缺等方面问题。文章从大数据时代档案数字资源整合的观念意识、分析系统、保障体系、人才建设四方面探讨了相关对策。关键词:大数据;档案数字资源整合中图分类号:G270.7文献标识码:A文章编号:1005-96

2、52(2015)01-0078-04现代管理科学的奠基人戴明曾经说过:“除了上帝,其他任何人都必须用数据说话”。[1]在大数据时代,数据已从原先的处理对象上升为一种影响人类生产生活各方面的基础性资源。在此背景下,档案部门要找到自身生存和发展的空间,就要正确认识档案数字资源的大数据特征,有效应对大数据规模效应给数据存储、管理、分析等带来的挑战,积极开展档案数字资源整合工作。一、档案数字资源的大数据特征大数据的“预测”思想为人们解决问题提供了新的视角和方法,它日渐成为一种新的社会现象,正在潜移默化中改变着人类的思维方式和生产生活模式。因此,作为人类社会实践活动真实记录的档案势必呈现大数据时

3、代的新特征。(一)数据量大,增长迅速在大数据时代,我国档案数字资源建设可分为“增量档案电子化,存量档案数字化”[2]两大部分。据国家档案局的统计资料显示,我国档案馆馆藏档案资源丰富,仅国家档案馆在2011年的馆藏已达3.3亿卷,预计到2020年将达到6亿多卷。[3]随着馆藏档案数字化工作的推进,它们将汇聚成巨大的档案数字资源库。另一方面,在大数据时代,电子档案的数量成倍增长。它不仅包含电子文件、图表、声像、数据库等,更会包括那些在纸质保管时代,因单位信息价值低经鉴定没有归档价值的原始记录,如访问日志、浏览轨迹等。因为大数据技术能挖掘出以前无法为人们所发现的数据的潜在价值,因此有必要对

4、数据的档案属性进行重新鉴定,自然会有海量数据新增到档案领域。(二)分布广泛,多源异构在大数据时代,随着人类探索领域的日渐深入,以及在此过程中数据保存能力的提高,档案来源将更加多样;加之移动终端的飞速发展更导致了数据产生方式呈现出多样性的特征。可见,大数据时代的档案数字资源将广泛存在于不同的信息系统中,会带有明显的时空特性,呈现出结构化信息、半结构化信息和非结构化信息相融合的态势,形成分布广泛的大量异构数据。(三)真实可靠,价值巨大在大数据时代,面对庞杂的新数据来源,信息价值密度正在大幅降低,人们更需要精确的信息来了解外部世界的真实情况,进而做出决策判断。档案作为人类社会最重要的本源信息

5、,在应对高并发、大数据量的利用访问需求时较之其它网络信息资源具有明显优势,因为它“是一种最真实、最可靠、最具权威性与凭证性的原生信息资源”[4](p11)。可见,在大数据时代档案价值将得到更广泛的关注,档案在人类生产生活中将发挥更大的作用。档案信息化·RESEARCHOFARCHIVES二、大数据时代档案数字资源整合的难点在大数据时代,由于档案数字资源具有上述与传统档案资源迥然不同的新特点,使其在整合方面面临诸多新的问题。其中,最主要的挑战来自以下几个方面:(一)数据存储问题在大数据时代,档案数字资源整合的首要挑战来自数据存储。一是档案管理系统在面对海量数据时需要高可扩展性的支撑。而目

6、前集中式的数据存储和管理模式非但资金投入较大,更无法适应档案数字资源体量激增的新情况,在档案数字资源的高效存储和快捷访问方面面临严峻挑战。二是目前基于关系型数据库研发的档案管理系统无法适应大数据时代占数据总量80%以上的非结构化数据存储和处理的需要。(二)数据分析问题大数据时代是一个泛在信息、泛在知识的时代,随着信息化程度的加深,档案数字资源的来源结构将发生巨大变化,传统的基于封闭的结构化数据进行的数据挖掘算法在分析处理非结构化数据时存在局限。而且,要获得大数据分析的价值,就应关注档案数字资源中的数据关系和语义表征,实现信息整合与知识整合。但目前档案数字资源整合还处于数据整合阶段,偏重

7、于实现异质异构数据在物理或逻辑上的集中和互联互通,仅能为用户提供信息检索服务,这与大数据时代的要求相去甚远。(三)安全隐私问题档案数字资源不同于其它信息资源,它是国家和社会精心挑选并保存下来的真实的历史记录,其中包含着大量国家秘密、工作秘密、个人隐私等重要信息,事关国计民生。在大数据时代,如何对档案数字资源中敏感数据的所有权和使用权做出明确界定?如何选择合适的安全防护策略以适应数据非线性增长的需求,杜绝安全隐患?如何应对大数据分布式处理带来的数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。