欢迎来到天天文库
浏览记录
ID:28055189
大小:17.98 KB
页数:5页
时间:2018-12-08
《基于mapreduce的ga―bp神经网络算法并行化设计及实现》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。基于MapReduce的GA―BP神经网络算法并行化设计及实现 摘要:为提高BP神经网络算法的运行效率,利用遗传算法和并行编程思想,提出了Hadoop平台下基于MapReduce的遗传算法优化BP神经网络的并行化设计及实现方法。利用遗传算法优化BP神经网络的初始权值和阈值,提高算法分类准确率;采用MapReduce并行编程模型实现
2、算法的并行化处理,解决BP神经网络在处理大规模样本数据集时存在的硬件开销和通信开销大的问题。选用Caltech256图像数据集,与传统的串行遗传算法优化BP神经网络算法实验对比,验证了并行化GA-BP神经网络算法的优越性。 关键词:遗传算法;BP神经网络;MapReduce并行编程模型;并行化设计 DOIDOI:/ 中图分类号:TP312 文献标识码:A文章编号:1672--0040-04 0引言为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色
3、栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。基于MapReduce的GA―BP神经网络算法并行化设计及实现 摘要:为提高BP神经网络算法的运行效率,利用遗传算法和并行编程思想,提出了Hadoop平台下基于MapReduce的遗传算法优化BP神经网络的并行化设计及实现方法。利用遗传算法优化BP
4、神经网络的初始权值和阈值,提高算法分类准确率;采用MapReduce并行编程模型实现算法的并行化处理,解决BP神经网络在处理大规模样本数据集时存在的硬件开销和通信开销大的问题。选用Caltech256图像数据集,与传统的串行遗传算法优化BP神经网络算法实验对比,验证了并行化GA-BP神经网络算法的优越性。 关键词:遗传算法;BP神经网络;MapReduce并行编程模型;并行化设计 DOIDOI:/ 中图分类号:TP312 文献标识码:A文章编号:1672--0040-04 0引言为了充分发挥“教学
5、点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。 BP神经网络是一种多层前馈型神经网络,是一种通过不断修改各层神经元之间的连接权值以及各神经元的阈值,以使网络输出不断逼近期望输出的学习过程[1]。由于它具有很强的
6、泛化能力,并可实现任何复杂程度的非线性映射关系,因此在很多领域得到了广泛应用[2]。然而,BP神经网络算法是基于函数误差梯度下降的思想,不具备全局搜索能力;而且,网络各层之间的连接权值和神经元的阈值在初始训练时是0~1的任意值,这会导致算法收敛速度慢,而且不一定得到最优解。近年来,学者们先后提出一些改进的算法来优化BP神经网络的初始权值和阈值,如遗传算法[3]、粒子群算法、萤火虫算法[4]等。然而,伴随着大数据时代的到来,样本规模愈来愈大,上述传统的串行算法不仅存在硬件支撑瓶颈的问题,而且算法训练时间会变得
7、很长,系统效率明显下降。目前,算法的并行化设计受到广泛关注。郑晓薇等[5]在MPI集群环境下设计了一种多BP神经网络并行集成模型,实现了图像的多语义分类,实验效果良好。刘晶[6]在PVM并行环境下,对大型矩阵运行进行了并行处理,有效降低了矩阵运算的耗时。但是,基于MPI和PVM的并行设计需要开发者对计算机硬件体系结构有较清晰的了解,并且各节点间通信耗时较大,实现也较困难[7]。而近年流行起来的Hadoop平台下的MapReduce框架是一种面向分布式环境的并行计算模式,它向开发人员提供了完整的编程接口,并不
8、需要开发者了解计算机的体系结构,因而逐渐成为当前算法并行化设计的研究热点[8]。针对上述问题,本文提出一种GA-BP神经网络的并行算法,并将其应用于图像分类问题中。该算法在MapReduce并行编程模型下设计并行处理机制,使用遗传算法优化BP神经网络的初始权值和阈值,再使用不同的优化后的多个并行BP神经网络训练采用不同的样本集,既保证了BP神经网络能获得最优解,又加快了网络收敛速度,而且在有效降低样本多样性和复杂
此文档下载收益归作者所有