大数据典型相关分析的云模型方法

大数据典型相关分析的云模型方法

ID:33937393

大小:1.19 MB

页数:15页

时间:2019-03-01

大数据典型相关分析的云模型方法_第1页
大数据典型相关分析的云模型方法_第2页
大数据典型相关分析的云模型方法_第3页
大数据典型相关分析的云模型方法_第4页
大数据典型相关分析的云模型方法_第5页
资源描述:

《大数据典型相关分析的云模型方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第34卷第10期通信学报Vol.34No.102013年10月JournalonCommunicationsOctober2013doi:10.3969/j.issn.1000-436x.2013.10.015大数据典型相关分析的云模型方法杨静,李文平,张健沛(哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001)摘要:针对传统大数据典型相关分析(CCA,canonicalcorrelationanalysis)方法的高复杂度在面临大数据PB级数据规模时不再适应的现状,提出了一种基于云模型的大数据CCA方法。该方法在云计算架构的基础上,通过云运算将各端点云合并为中

2、心云,并据此产生中心云滴,以中心云滴作为大数据的不确定性复原小样本,在其上施以CCA运算,中心云滴的较小数据量提高了运算效率。在真实数据集上的实验结果验证了该方法的有效性。关键词:大数据;典型相关分析;云模型;云运算;云计算中图分类号:TP391文献标识码:B文章编号:1000-436X(2013)10-0121-14CanonicalcorrelationanalysisofbigdatabasedoncloudmodelYANGJing,LIWen-ping,ZHANGJian-pei(CollegeofComputerScienceandTechnology,Har

3、binEngineeringUniversity,Harbin150001,China)Abstract:ThecomplexityoftraditionalCCAmethodsistoohightomeettherequirementstoanalyzebigdataduetotheirhugescalewhichisreachingthelevelofpeta-byte.AnovelapproachtoCCAwasproposedtominethebigdatabyintroducingthecloudmodelwhichisabrand-noweltheoryabo

4、uttheuncertaintyartificialintelligence.Adistributedar-chitecturebasedoncloudcomputingwasestablished.Allofthecloudsdistributingonthenodesofthedistributedarchi-tecturewerecombinedtoacentercloudviacloudoperation(wherecloudisasynopsisofdataandwhichisaconceptcomingfromthecloudtheory).Atypeofvi

5、rtualsampleofdatacalledclouddropscreatedbasedonthecentercloud.Fi-nallythecomputingofCCAwasimposedontheclouddrops.TheCCAwasimposeontheclouddropswithlessvolume,whichimprovestheefficiency.Experimentalresultsonrealdatasetsindicatetheeffectivenessofthismethod.Keywords:bigdata;canonicalcorrelat

6、ionanalysis(CCA);cloudmodel;cloudoperation;cloudcomputing大数据典型相关分析(CCA,canonicalcorrela-1引言tionanalysis)是大数据研究的重要内容之一,它自2008年9月《Nature》杂志推出名为“大数不仅有助于揭示大数据间的相关关系,而且可提[1]据”(bigdata)的封面专栏以来,产业界和学术取蕴含于大数据中的低维特征。大数据CCA可用[2][3][4]界便掀起了大数据研究热潮。数据量巨大是大数据于大数据特征融合、机器学习、数据降维、[5]的首要特性,通常认为PB级别及其以上的数据

7、称为数据流挖掘等领域。因此大数据CCA具有重要“大数据”。大数据还具有稀疏价值特性,即大数的意义。据所携带的信息在刻画某特定知识方面是冗余的。大数据CCA研究极具挑战性,其困难不仅这些特性为大数据挖掘带来了巨大的挑战。源于CCA本身具有的高复杂度,而且也来自大收稿日期:2013-04-21;修回日期:2013-07-30基金项目:国家自然科学基金资助项目(61370083,61073043,61073041);高等学校博士学科点专项科研基金资助项目(20112304110011,20122304110012);黑龙江省自然科学

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。