_大数据_时代科学数据整合研究_白如江new

_大数据_时代科学数据整合研究_白如江new

ID:34383989

大小:732.16 KB

页数:6页

时间:2019-03-05

_大数据_时代科学数据整合研究_白如江new_第1页
_大数据_时代科学数据整合研究_白如江new_第2页
_大数据_时代科学数据整合研究_白如江new_第3页
_大数据_时代科学数据整合研究_白如江new_第4页
_大数据_时代科学数据整合研究_白如江new_第5页
资源描述:

《_大数据_时代科学数据整合研究_白如江new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、实践研究欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟1,21●白如江,冷伏海(1.中国科学院国家科学图书馆,北京100190;2.山东理工大学图书馆,山东淄博255049)*“大数据”时代科学数据整合研究摘要:随着信息与网络技术的发展,科学研究过程中产生出了大量的原生数字科学数据。在“大数据”时代,科学数据日趋发展的今天,整合集成科学数据,实现科学数据共享与互操作具有重要的意义。文章首先梳理了与“大数据”有关的基本概念以及相关研究发展脉络,然后针对“大数据”环境下科学研究的特点,指出了“大数据”时代科学数据整合的挑战。详细论述了目前

2、科学数据整合的主要理论与方法,并选取了3个具有代表性的科学数据整合系统平台进行了介绍。关键词:大数据;科学数据;整合研究Abstract:Withthedevelopmentofinformationandnetworktechnology,alargenumberofnativedigitalscientificdatahasbeenproducedinthescientificresearchprocess.Intheeraof“bigdata”whenscientificdataisincreasinglydeveloping,ithasanimportantmeaning

3、tointegratescientificdataandrealizethesharingandinteroperabilityofscientificdata.First,thepapercombsthebasicconceptsrelatedtothe“bigdata”aswellastherelatedresearchdevelopment.Then,thepaperpointsoutthechallengesfromscientificdataintegrationintheeraof“bigdata”accordingtothecharacteristicsofscie

4、ntificresearchintheenvironmentof“bigdata”.Finally,thepaperdiscussesthemaintheoriesandmethodsofthecurrentscientificdataintegrationindepth,andse-lects3representativescientificdataintegrationplatformsforintroduction.Keywords:bigdata;scientificdata;integrationresearch1背景日趋发展的今天,整合集成科学数据,实现科学数据共享科

5、学研究正在进入到一个崭新的阶段。随着信息与网与互操作性,构造基于科学数据的、开放协同的科学研究络技术的发展,科学研究在计算机仿真、模拟、传播等过新范式具有重要的意义。程中产生出了大量的原生数字科学数据。这些数据包括实2“大数据”时代科学数据整合面临的挑战验模拟数据、仪器观测数据等。除去以论文、图书形式发在“大数据”时代,典型的科学研究场景描述如下。布的科学数据外,大量的蕴藏着科学理论的科学数据经常某科学家准备开展碳纳米管制备方面的研究。在做这被淹没在零零散散的实验室里。而我们现在需要将这些科方面的研究之前,该科学家需要了解该研究领域的研究现学数据像纸质文献一样长期保存起来,让科研

6、人员公开获状,于是他就利用WebofScience(WoS)数据库查找此取。这样科学家可以从存储的科学数据中发现和理解自然研究领域的文献资料。由于WebofScience数据库只提供与世界。未来的科学研究更多的是数据驱动的、协作的和了文摘信息,看到感兴趣的文献后,该科学家不得不又到跨学科的。这就是微软发布的基于数据密集型计算的科学该文献的全文数据库(如Elsevier)中获得全文。当然,[1]研究第四范式。除此之外,科学数据的爆炸式增长也给WoS数据库也提供全文链接,但是有些全文数据库,该科前沿科学项目带来了巨大挑战。数据集的增长已经超过数学家所在的单位没有购买,只好又通过其他途

7、径获得,比[2]十万亿字节,正如美国奥巴马总统委员会的科技顾问如到GoogleScholar或MicrosoftAcademicSearch中获取。S.Brobst所说:“过去3年里产生的数据量比以往4万年为了获取该领域的研究文献该科学家就花费了相当长的时的数据量还要多”。“大数据”时代的来临已经毋庸置疑。间。获得该研究领域的文献后,该科学家还想了解碳纳米我们即将面临一场科学研究范式变革,大科学数据管理将管研究领域的专利申请情况,于是就到专利数据库进行搜成为未来科学研究的当务之急

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。