资源描述:
《网络大数据计算技术与应用综述》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、科研信息化技术与应用2013,4(6):3–14·论坛 / PERSPECTIVE·网络大数据计算技术与应用综述程学旗,王元卓,靳小龙中国科学院计算技术研究所,北京100190摘要:网络大数据蕴含着丰富的社会信息,可以看作是对真实社会的网络映射。分析网络大数据并发现其中所暗含的线索与规律,可以帮助人们更好地感知现在、预测未来。本文简要介绍了国内外有关网络大数据的战略布局,总结了网络大数据计算技术研究面临的挑战,并从网络大数据计算的架构体系以及网络大数据的感知与表示、内容建模与语义理解等方面分析了研究现状。最后,通过实例对网络大数据将带来的新型应用进行了展望。关键
2、词:网络大数据;自媒体数据;富媒体数据;数据复杂性ASurvey:ComputingTechnologyofNetworkBigDataandItsApplicationsChengXueqi,WangYuanzhuo,JinXiaolongInstituteofComputingTechnology,ChineseAcademyofSciences,Beijing100190,ChinaAbstract:Duetotheextensiveinvolvementofusersintovariousnetworkapplications,networkbigdat
3、acontainsrichsocialinformationandcanconsequentlybeviewedasanetworkmappingoftheactualsociety.Analyzingnetworkbigdatatofindtheimplicitcluesandlawscanhelpusmoreaccuratelyperceivepresentandforecastfuture.Thispaperbrieflyreviewsthenetworkbigdatarelatedstrategicinitiativesallovertheworld,s
4、ummarizesthegrandchallengesconfrontedbythecomputingtechnologystudyofnetworkbigdata,andanalyzestheresearchstatusfromdifferentaspectsincludingthearchitectureofbigdatacomputing,theawareness,representation,contentmodeling,andsemanticunderstandingofnetworkbigdata,etc.Finally,welookforward
5、totheinnovativeapplicationsofnetworkbigdatabasedonrealisticexamples.Keywords:networkbigdata;we-mediadata;rich-mediadata;datacomplexity基金项目:国家重点基础研究发展计划(973计划)(2012CB316303,2013CB329602);国家自然科学基金重点项目(61232010,60933005);国家自然科学基金面上项目(61173008,61100175);国家高技术研究发展计划(863计划)(2012AA011003)3科
6、研信息化技术与应用,2013,4(6)引言的特点是,具有大量的历史性数据、同时数据增速极快、数据访问吞吐量巨大。一般意义上,大数据是指无法在可容忍的时间内富媒体数据指聚合多种媒体数据(包括文本、音用现有IT技术和软硬件工具对其进行感知、获取、视频、图片、文字、消息等)动态、交互的体现,富管理、处理和服务的数据集合。以数据为中心的传统媒体并不单纯是互联网多媒体形式,而是指具有动学科(如基因组学、天体物理学和脑科学等)的研究画、声音、视频或交互性的信息传播方法。富媒体的[1]工作产生了越来越多的数据。例如,用电子显微镜内容包括HTML、Javascripts、Int
7、erstitial间隙窗口、重建大脑中的突触网络,1立方毫米大脑的图像数据MicrosoftNetshow、RealVideo和RealAudio、Flash等就超过1PB。但近年来大数据的飙升主要来自人们的所产生或解析的数据,涉及的数据不仅仅是多媒体数日常生活,特别是互联网公司的服务。据著名咨询公据,还包括分类标注、内容标签、格式编码、内容集司IDC的统计,2012年全球被创建和复制的数据总成、流化处理、数字影院、用户端、数字版权保护和量为2.7Zb(1Zb相当于十万亿亿字节),预计到2020管理等诸多信息。因此其特点除了数据量巨大以外,年,全球的数据总量将达
8、到35Zb,其中75%来