基于hadoop的差分进化极限学习机研究

基于hadoop的差分进化极限学习机研究

ID:35056977

大小:3.47 MB

页数:70页

时间:2019-03-17

基于hadoop的差分进化极限学习机研究_第1页
基于hadoop的差分进化极限学习机研究_第2页
基于hadoop的差分进化极限学习机研究_第3页
基于hadoop的差分进化极限学习机研究_第4页
基于hadoop的差分进化极限学习机研究_第5页
资源描述:

《基于hadoop的差分进化极限学习机研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于Hadoop的差分进化极限学习机研究学科专业计算机软件与理论学位类型√□科学学位□专业学位研究生姓名彭辉导师姓名、职称唐文胜教授论文编号湖南师范大学学位评定委员会办公室二零一六年五月分类号密级学校代码10542学号201302110909基于Hadoop的差分进化极限学习机研究AStudyofDifferentialEvolutionExtremeLearningMachinebasedonHadoop研究生姓名彭辉指导教师姓名、职称唐文胜教授学科专业计算机软件与理论研究方向云计算湖南师范大学学位评定委员会办公室二零一六年五月摘要差分进

2、化极限学习机(DifferentialEvolutionExtremeLearningMachine,DE-ELM)是一种具有泛化性能好、分类精度高的机器学习算法,受到业界的广泛关注。然而随着数据爆炸式增长,传统DE-ELM很难满足海量高维数据处理的需求。开源云计算Hadoop平台具有成本低、容错率高、扩展性强的特点,对处理海量高维数据具有很强的适应性,为解决上述问题提供了有效手段。因此,如何将传统的DE-ELM并行化,部署到云计算Hadoop平台上具有重要的研究意义。本文在云计算Hadoop平台研究了差分进化极限学习机分布式算法,并对分布式算法早熟收

3、敛问题进行了改进。主要工作如下:(1)针对DE-ELM处理海量高维数据时计算复杂速度慢的瓶颈,提出了基于云计算Hadoop平台的差分进化极限学习机分布式算法(MapReduceofDifferentialEvolutionExtremeLearningMachine,MR-DE-ELM),提高了算法的运行速度。算法的主要思想是:MR-DE-ELM计算最复杂的部分是大规模矩阵乘法和大规模矩阵转置的运算,根据矩阵乘法每个元素的计算彼此间不存在依赖关系,采用并行计算,把大规模矩阵乘法转换成向量点乘和向量求和两个过程;通过合理设定元素的(key,value)键

4、值对,实现大规模矩阵的转置。实验表明MR-DE-ELM提高了处理海量高维数据的能力。(2)分析MR-DE-ELM,针对差分进化算法(DifferentialEvolution,DE)早熟收敛,导致MR-DE-ELM的分类精度不足的问题,I提出了基于双种群双策略的改进差分进化极限学习机分布式算法(MapReduceofDifferentialEvolutionExtremeLearningMachinebasedonDual-populationsandDual-strategy,MR-DpsDE-ELM),提高了算法的分类精度。算法的主要思想是:首先,

5、在进化过程中将种群划分成两个子种群,每个子种群在变异、交叉阶段分别设定不同的变异策略和交叉算子。然后,并行独立进化每个子种群且互不干扰,设定进化代数G,判定子种群间是否进行信息交换,如果进行信息交换,比较m各个子种群的最优个体,用最优个体淘汰其余种群的最差个体。最后,设定最大迭代次数G作为算法的停止条件。实验表明maxMR-DpsDE-ELM改善了早熟收敛现象,提高了分类精度。关键词:差分进化算法,极限学习机,MapReduceIIABSTRACTDE-ELMischaracterizedwithgoodgenerationperformanceand

6、highclassificationaccuracyofmachinelearningalgorithms,andhasreceivedextensiveattentionintheindustry.However,withthedataexplosion,thetraditionalDE-ELMishardtomeettheneedsofmassiveandhigh-dimensionaldataprocessing.TheopensourceHadoop(onekindofthecloudcomputingplatforms)isaplatform

7、withlowcost,higherror-tolerancerateandstrongadaptabilitytoprocessingmassiveandhigh-dimensionaldata,whichprovideseffectivemeanstosolvetheaboveproblems.Therefore,thestudyofhowtoparalyzetraditionalDE-ELManddeployittoHadoopareofgreatsignificance.BasedonHadoopplatform,theMapReduceofD

8、E-ELMisstudiedandtheprematureconvergenceproblem

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。