基于卷积神经网络的小麦叶部病害图像识别研究

基于卷积神经网络的小麦叶部病害图像识别研究

ID:76119815

大小:5.81 MB

页数:81页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
基于卷积神经网络的小麦叶部病害图像识别研究_第1页
基于卷积神经网络的小麦叶部病害图像识别研究_第2页
基于卷积神经网络的小麦叶部病害图像识别研究_第3页
基于卷积神经网络的小麦叶部病害图像识别研究_第4页
基于卷积神经网络的小麦叶部病害图像识别研究_第5页
基于卷积神经网络的小麦叶部病害图像识别研究_第6页
基于卷积神经网络的小麦叶部病害图像识别研究_第7页
基于卷积神经网络的小麦叶部病害图像识别研究_第8页
基于卷积神经网络的小麦叶部病害图像识别研究_第9页
基于卷积神经网络的小麦叶部病害图像识别研究_第10页
资源描述:

《基于卷积神经网络的小麦叶部病害图像识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

分类号:TP1810434授予学位单位代码:1研究生学号:2015110654c山東農業大學硕士学位论文基于卷积神经网络的小麦叶部病害图像识别研究TheResearchofWheatLeafDiseaseImaesIdentificationBasedgonConvolutionalNeuralNetwork研究生:林中琦学科专业:计算机应用技术研究方向:机器学习学院:信息科学与工程学院指导教师:牟少敏教授2018年6月11日 论文提交日期18年4月25日:20论文答辩日期:2018年6月09日学位授予日期:2018年6月学位类别:工学答辩委员会主席:刘明军 关于学位论文原创性和使用授权的声明本人所呈交的学位论文,是在导师指导下,独立进行科学研宄所取得的成果。对在论文研究期间给予指导、帮助和做出重要贡献的个人或集体,均在文中明确说明。本声明的法律责任由本人承担。本人完全了解山东农业大学有关保留和使用学位论文的规定,同意学校保留和按要求向国家有关部门或机构送交论文纸质本和电子版,允许论文被查阅和借阅。本人授权山东农业大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文和汇编本学位论文,同时授权中国科学技术信息研宄所将本学位论文收录到。《中国学位论文全文数据库》,并向社会公众提供信息服务保密论文在解密后应遵守此规定。论文作者签名:导师签名:年,炎2〇、日期:18叫 符号说明CNN:ConvolutionalNeuralNetwork,卷积神经网络MLP:Multi-LayerPerception,多层变种感知机F-gDACNN:Fine-grainedDifferentialAmplificationConvolutionalNeuralNetwork,细粒度差分放大卷积神经网络MCNN:MultichannelConvolutionalNeuralNetwork,多道式卷积神经网络LSVM:LocalSupportVectorMachine,局部支持向量机NBM:NaiveBayesianModel,朴素贝叶斯SVM:SupportVectorMachine,支持向量机LR:LogisticRegression,逻辑回归FD:FisheDiscriminant,费歇尔判别法KNN:K-NearestNeighbor,K-均值聚类LDP:LocalDiscriminantProjects,局部判别映射RBF:RadiusBasisFunction,径向基核函数SRM:StructureRiskMinimization,结构风险最小化ERM:EmpiricalRiskMinimization,经验风险最小化LRN:LocalResponseNormalization,局部响应归一化LCN:LocalContrastNormalization,局部对比度归一化SGD:StochasticGradientDescent,随机梯度下降法UAL:UniformApproximateLocalizability,均匀近似可局部性UALC:UniformApproximateLocalConsistency,均匀近似局部一致性ReLU:RectifiedLinearUnit,线性整流函数ANN:ArtificialNeuralNetwork,人工神经网络MCNN-FP:MultichannelConvolutionalNeuralNetwork-FeedforwardPass,MCNN前向传播MCNN-BP:MultichannelConvolutionalNeuralNetwork-BackpropagationPass,MCNN反向传播 目录中文摘要..................................................................................................................................IAbstract...................................................................................................................................III1绪论.........................................................................................................................................11.1研究背景和意义..................................................................................................................11.2农作物病害图像识别的国内外研究现状..........................................................................21.2.1农作物病害图像识别的国外研究现状...........................................................................21.2.2农作物病害识别的国内研究现状...................................................................................31.3深度学习研究现状..............................................................................................................51.4主要研究内容和论文结构..................................................................................................61.4.1主要研究内容...................................................................................................................61.4.2论文结构...........................................................................................................................62卷积神经网络.........................................................................................................................82.1卷积神经网络发展..............................................................................................................82.2卷积神经网络特点..............................................................................................................92.3卷积神经网络拓扑结构......................................................................................................92.4卷积神经网络的训练过程................................................................................................182.5本章小结............................................................................................................................193基于细粒度差分放大卷积神经网络的小麦叶部病害图像识别.......................................203.1引言....................................................................................................................................203.2细粒度差分放大卷积神经网络........................................................................................203.2.1卷积核矩阵.....................................................................................................................213.2.2差分放大支路.................................................................................................................243.3数据获取与预处理............................................................................................................263.3.1数据获取.........................................................................................................................263.3.2数据预处理.....................................................................................................................273.4实验设计与结果分析........................................................................................................283.5本章小结............................................................................................................................32 4基于多道式卷积神经网络的小麦叶部病害图像识别.......................................................334.1引言....................................................................................................................................334.2多道式卷积神经网络........................................................................................................334.2.1多道式卷积神经网络的结构.........................................................................................334.2.2多道式卷积神经网络的训练过程.................................................................................374.3实验设计与结果分析........................................................................................................414.4本章小结............................................................................................................................475基于CNN-LSVM模型的不平衡小麦叶部病害图像识别...............................................485.1引言....................................................................................................................................485.2CNN-LSVM模型..............................................................................................................485.2.1小麦叶部病害图像的不平衡性.....................................................................................485.2.2CNN-LSVM的结构设计...............................................................................................495.3数据获取与预处理............................................................................................................565.3.1数据获取.........................................................................................................................565.3.2数据预处理.....................................................................................................................575.4实验设计与结果分析........................................................................................................595.5本章小结............................................................................................................................626总结与展望...........................................................................................................................636.1本文总结............................................................................................................................636.2工作展望............................................................................................................................63参考文献...............................................................................................................................65致谢.........................................................................................................................................70攻读学位期间发表论文情况..................................................................................................71 山东农业大学硕士论文中文摘要卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种受Hubel-Wiesel生物视觉系统启发的多层变种感知机(Multi-LayerPerception,MLP),它无须改变图像的拓扑结构,能在训练数据驱动下通过多层非线性映射自适应构建隐式特征描述,通过局部感知视野、权值共享、下采样等设计理念实现特征的逐层剖析,减少参数数量,使提取到的图像特征对旋转、平移和缩放等变换具有鲁棒性,且特征提取和识别同时进行,避免了浅层学习中的显式特征提取和数据重构环节。近几年,CNN在人脸识别、指纹识别等图像识别领域中效果显著。本文以提高小麦叶部病害图像识别精度为目标,展开了CNN的相关研究工作,主要研究内容如下:(1)提出了一种基于细粒度差分放大卷积神经网络(Fine-grainedDifferentialAmplificationConvolutionalNeuralNetwork,F-gDACNN)的小麦叶部病害图像识别。该模型有2点改进:卷积核矩阵和差分放大支路,前者能够增加网络深度、神经元以及神经元链接的数量,同时抑制参数膨胀,且不同滤波器所提取的特征能够相互融合,进而产生新的图像特征;后者能够放大真实输出与期望输出之间的微小差异,使权重更新对于每次迭代产生的反馈误差更加敏感,增加网络对于数据集的拟合能力,防止欠拟合。F-gDACNN模型适用于对病症外观差别较小的小麦叶部病害图像进行分类。(2)提出了一种基于多道式卷积神经网络(MultichannelConvolutionalNeuralNetwork,MCNN)的小麦叶部病害图像识别。受视频显著性检测中人类视觉行为习惯的启发,该模型在传统CNN串行结构的基础上添加支路,允许网络中第1个和第2个下采样层直接与第1个全连接层相连,实现了不同层次图像特征的综合利用。此外,为了防止过拟合(Overfitting)、梯度弥散(DiffusionofGradients)的发生,模型加入了线性整流函数(RectifiedLinearUnit,ReLU)、Dropout、局部对比度归一化(LocalContrastNormalization,LRN)和局部响应归一化(LocalResponseNormalization,LCN),使网络结构更加完善,但计算量也会增加。(3)提出了一种针对不平衡小麦叶部病害图像识别的CNN-LSVM。由于CNN无法较好地对不平衡数据进行分类,本文将局部支持向量机(LocalSupportVectorMachine,LSVM)与CNN相结合,提出了一种CNN-LSVM模型,有效提高了对不平衡小麦叶部病害图像的分类精度。根据不平衡数据集的特点设计了代价敏感矩阵,并对LSVMI 基于卷积神经网络的小麦叶部病害图像识别中的优化目标函数中的惩罚参数进行赋值,使模型对于因数据集的不平衡性导致的误分状况更加敏感,修正模型的收敛走势,使其适用于不平衡数据集的分类。CNN-LSVM模型既保留了CNN自动提取图像深层特征的优势,又融合了改进的LSVM缓解不平衡分类问题以及充分利用样本局部信息的特点。关键字:卷积神经网络;小麦叶部病害;图像识别;特征提取II 山东农业大学硕士论文TheResearchofWheatLeafDiseaseImagesIdentificationBasedonConvolutionNeuralNetworkAbstractConvolutionalneuralnetwork(CNN)isavariantMulti-LayerPerception(MLP)inspiredbytheHubel-Wieselbiologicalvisualsystem.Theimplicitdescriptionofimagefeaturecanbeadaptivelyconstructedbymulti-layernonlinearmapping,whichdoesn'tneedtochangethetopologyoftheimage.Thelayer-by-layeranalysisoffeaturescanberealizedthroughlocalreceptivefield,weightsharing,subsampling.Atthesametime,thenumberofparametercanbereducedandtheextractedimagefeaturesarerobusttotherotation,translation,scalingandothertransformations.What'smore,featureextractionandpatternrecognitionarecarriedoutatthesametime,avoidingexplicitfeatureextractionanddatareconstructionofsurfacelearning.Inrecentyears,theremarkableachievementshasbeenachievedbyCNNinthefieldsoffacerecognition,fingerprintrecognitionandothers.Aimingatimprovingtheaccuracyofwheatleafdiseaseimageidentification,themainresearchofCNNarecarriedoutinthispaper.Themaincontentsareasfollows:(1)AmethodforidentificationofwheatleafdiseasesbasedonFine-graineddifferentialamplificationconvolutionalneuralnetwork(F-gDACNN)isproposed.Itmainlyhas2improvements:convolutionalkernelmatrixanddifferentialamplificationbranch.Theformercaneffectivelyincreasingthenumberofneuronsandlinkchannelsandsuppressingparameterexpansion.Atthesametime,thefeaturemapsextractedfromdifferentfilterscanfusewitheachother,whichcanproducenewfeatures;Thelattercanamplifysmalldifferencesbetweentherealoutputandtheexpectedoutput,sotheweightupdatingbecomemoresensitivetothelighterrorsinthebackpropagationpass.Thisstructuresignificantlyimprovesthemodel'sfittingcapabilityandreducesunderfitting.(2)Amethodforidentificationofwheatleafdiseasesbasedonmultichannelconvolutionalneuralnetwork(MCNN)isproposed.Inspiredbythehumanvisualbehaviorinvideosaliencydetection,thebranchesareaddedonthebasisoftheserialstructure.Thefirstandsecondsubsamplinglayersareconnecteddirectlywiththefirstfullyconnectedlayer,whichrealizedthecomprehensiveutilizationoftheimagefeaturesindifferentlevels.Inaddition,themixedmodesofrectifiedlinearunits(ReLU),Dropout,localcontrastIII 基于卷积神经网络的小麦叶部病害图像识别normalization(LRN)andlocalresponsenormalization(LCN)areintroducedtopreventoverfittingandgradientdiffusionandmakethenetworkstructuremoreperfect.(3)AmethodforidentificationofimbalancedwheatleafdiseasesbasedonCNN-LSVMisproposed.InviewofthelowaccuracyofCNNinimbalanceddataidentification,aCNN-LSVMmodelisproposedbycombininglocalsupportvectormachine(LSVM)withCNNinthischapter.Then,consideringtheimbalanceinthenumberandspatialdistributionofthesamples,acostsensitivematrixisdesignedtoassignthevalueforpenaltyfactorsintheoptimizedobjectivefunctionofLSVM.Itmakesthemodelmoresensitivetothemisdivisioncausedbytheimbalancesofthesamplesandmodifytheconvergencetrendofthemodel,whichmakesthemodelmoresuitabletotheclassificationofimbalanceddatasets.ThismodelnotonlypreservestheadvantageofautomaticabstractionofabstractionfeaturesbyCNN,butalsointegratestheimprovedLSVMtoalleviatetheproblemofimbalancedclassificationandtomakefulluseofthelocalinformationofsamples.Keywords:ConvolutionalNeuralNetworks;WheatLeafDisease;ImageRecognition;FeatureExtractionIV 山东农业大学硕士学位论文1绪论1.1研究背景和意义小麦是我国第二大粮食作物,超过30%的人口以小麦为主要粮食,小麦病害对其产量有很大的影响,我国发生较重的小麦病害种类有20多种,危害较为严重的有小麦白粉病、小麦锈病、小麦叶枯病、小麦纹枯病等。在我国,每年因小麦病害损失的产量约为总产量的三分之一,这对我国粮食生产有很大的危害,因此,小麦病害的快速、精准识别成为了农业生产中迫切需要实现的技术。由于农作物病害的症状是复杂多样的,传统的农作物病害识别依赖于专业技术人员,识别方法可归纳为以下3种:农业病害图谱法、农业病害著作法和分类检索表法,但这些方法不仅费时费力,专业性强,且获取病害信息滞后,严重影响病害预警与实施防治工作的时效性。1990年后,人工智能快速发展,各种浅层学习算法层出不穷,例如:朴素贝叶斯(NaiveBayesianModel,NBM)(Rusakovetal.,2005),支持向量机(SupportVectorMachine,SVM)(Hearstetal.,2002),逻辑回归(LogisticRegression,LR)(Conklinetal.,2000),Boosting(Friedmanetal.,Friedman)等,均为农作物病害的自动精准识别提供了强有力的理论支持。但这些基于浅层学习的作物病害识别方法依赖于图像的显式特征(如SIFT,LBP,HOG,ORB)提取,这些图像特征的提取策略是人们基于先验知识制定的,一方面步骤繁杂,效率较低,特征提取依赖研究人员的知识和经验;另一方面,这些人工提取的特征往往存在于图像浅层,适用面窄(Leeetal.,2009;Zhaoetal.,2010)。近年来,深度学习在图像识别领域中发展火热,它是具有若干隐层的机器学习架构模型,其动机在于建立和模拟人脑的神经系统来解释图像、声音、文本等数据,能够自动挖掘和组合隐藏在图像更深处的抽象特征,使提取到的特征具有更好的泛化能力和表征能力,规避了上述基于浅层学习算法实现的作物病害识别的缺陷。因此,本文采用深度学习中的经典算法—CNN作为小麦叶部病害图像识别的理论基础,并对其进行改进并应用到小麦叶部病害的识别中,以达到理想的分类精度。CNN是一种受Hubel-Wiesel生物视觉系统启发的多层变种感知机(Hubeletal.,1962),起源于共享权值网络(SharingWeightsNeuralNetwork)(Rishietal.,2015;Pujarietal.,2013),相比浅层学习算法,它有以下3点优势:1 基于卷积神经网络的小麦叶部病害图像识别(1)CNN无须改变图像拓扑结构,而是在训练数据驱动下,通过多层非线性映射自适应地构建特征的隐式描述,这些特征更能表达数据的分布特点(Tiviveetal.,2006)。(2)特征提取和识别同时进行,避免了依靠先验知识设计的显式特征提取和数据重构环节,更加省时、省力,优于“先特征提取,后模式识别”的识别方法(LeCunetal.,1998;LeCunetal.,1989)。(3)CNN具有3种设计理念:局部感受野、权值共享和下采样,3者降低了网络的结构复杂度,且使提取的图像特征对旋转、平移、缩放等变化具有一定的鲁棒性,在模拟高度非线性关系和表示复杂函数方面,CNN比浅层学习具有更强的表征能力。本文提出的CNN模型可以准确快速地识别小麦叶部病害图像,为病害的科学防治提供了理论基础和技术支持。1.2农作物病害图像识别的国内外研究现状1.2.1农作物病害图像识别的国外研究现状在国外,通过图像对农作物病害进行识别的研究起步较早,可追溯到20世纪80年代末,早期的识别方法大多是直接对农作物病害图像进行较为简单的处理图像和分析,再结合与农学和病理学等相关专业知识对处理后的图像进行分类。1984年,Sarkar和Wolfe等(Sarkaretal.,1984)利用数字图像分析识别技术研制出番茄品质分级装置,能够较为准确地区分新鲜番茄和害病、虫咬、腐坏的番茄,但算法速度较慢;1995年,Panigahi等(Panigrahietal.,1995)通过获取玉米穗缺损部位图像的灰度值变化来识别虫害的种类。随着机器学习的快速发展,人们尝试采用不同算法来实现自动、精确的农作物病害识别。1999年,YuatakaSASAKI等(SASAKIetal.,1999)实现了基于遗传算法的黄瓜炭疽病自动诊断技术,该技术从分光反射和光学滤波2个角度定义了算法参数,实现了病害的自动识别,但是识别度没有达到实际需求;2003年,YuatakaSasaki(Sasakietal.,2003)通过遗传算法对病害区域的的形状特征进行了分析,整合出了更适合病害种类识别的参数;Sena等(Senaetal.,2003)实现了一种计算机视觉系统,能够自动获取并分析植被受巴西夜蛾损害的状况,分类效果显著;2006年,MohammedEl-Helly等(Sammanyetal.,2006)实现了基于人工神经网络的黄瓜叶片病斑识别系统,该系统能够较好地识别白粉病、霜霉病和受到虫蚀的叶片;2007年,Mohammad2 山东农业大学硕士论文Sammany等(Sammanyetal.,2007;Sammanyetal.,2006)首先通过遗传算法来优化神经网络的结构和参数,然后通过该神经网络对植物病害进行识别,他们又利用粗糙集简化了分类器中特征向量的数量,两种方案均取得较好的识别效果;2013年,Jagadeesh等(Pujarietal.,2013)实现了一种基于K-means分割、SVM和人工神经网络(ArtificialNeuralNetwork,ANN)的植物叶片识别系统,取得了较好的分类结果;2015年,Nikita等(Rishietal.,2015)实现了一种基于自适应k-均值聚类算法和PCA算法的植物病害识别算法,取得了较好的效果;Rupali等(Rupalietal.,2015)实现了一种基于SVM和NBM的小麦籽粒分级系统,能够将籽粒分为缺损、腐坏、正常等级别。1.2.2农作物病害识别的国内研究现状国内对于农作物病害图像识别的研究起步相对于国外较晚,但后期发展较快,实现了许多卓有成效的识别技术。2005年,王克如(王克如等,2015)提取了图像的能量、熵及惯性矩等纹理特征来识别玉米病害种类,实验结果表明,通过单一特征的识别精度在90%左右,通过3种图像特征的识别精度高达100%;2007年,宋凯等(宋凯等,2007)实现了一种基于SVM多分类器的玉米病灶识别方法,能够对图像的小波特征进行分析识别,其最优识别率为89.6%;田有文等(田有文等,2007)实现了基于支持向量机的葡萄叶部病斑的自动识别算法,该算法通过实现提取的颜色、纹理、形状特征实现病斑识别;岑喆鑫等(岑喆鑫等,2007)实现了基于遗传算法的黄瓜炭疽病的自动识别技术;彭占武(彭占武等,2007)实现了基于模糊识别模式的黄瓜常见病害的自动识别,识别精度为93.3%;赵玉霞等(赵玉霞等,2007)实现了基于朴素贝叶斯分类器的玉米发病叶片的自动识别技术,识别精度超过83%;2008年,赵进辉等(赵进辉等,2008)实现了对甘蔗病害的自动识别,首先获取赤腐病和环斑病病变区域的颜色、形状等图像特征,探后采用链码分割和面积阈值对其进行识别,取得了较高的识别精度;毛罕平等(毛罕平等,2008)实现了基于模糊C-均值聚类的农作物病斑区域自动分割技术,能够对玉米、棉花等农作物的病斑区域进行分割和提取;2009年,王娜等(王娜等,2009)实现了一种基于遗传算法和费歇尔判别法(FisheDiscriminant,FD)的玉米叶部病害识别方法,能够对28维图像特征进行分类,取得了良好的识别效果;王守志等(王守志,2009)实现了一种基于Mercer核和K-均值聚类(K-NearestNeighbor,KNN)的彩色玉米叶部病害图像识别的算法;祁广云等(祁广云等,2009)实现了基于BP神经网络和遗传算法的大豆叶片病斑自动提取的方法,能精3 基于卷积神经网络的小麦叶部病害图像识别确切分和提取病变叶片的区域;2010年,管泽鑫等(管泽鑫等,2010)实现了基于的水稻病害自动识别系统;蔡清等(蔡清等,2010)实现了基于BP神经网络的菜叶虫害自动识别技术,识别效果达到实际应用需求;柴阿丽等(柴阿丽等,2010)实现了基于贝叶斯判别法的番茄叶部病害的自动识别,其识别精度为94.71%;2011年,张柏毅等(张柏毅等,2011)实现了基于模糊C-均值聚类的农作物叶片病斑图像的分割和病害种类的识别;陈丽等(陈丽等,2011)实现了基于概率神经网络的玉米叶部病害识别方法,识别精度达到了90.4%;2012年,任玉刚(任玉刚等,2012)实现了基于分水岭算法黄瓜病害区域自动分割技术,分割吻合率超过90%;刘立波(刘立波等,2010)分别实现了基于模糊C均值聚类算法和的水稻叶部病害图像的自动分割方法;YuanTian等(Tianetal.,2010)提出了一种基于SVM的小麦叶片病害识别多分类器系统,该系统采用堆叠泛化结构,通过3种基于SVM实现的决策系统对小麦叶片病害进行分类,并取得了较好效果;2013年,柴洋等(柴洋等,2013)实现了基于贝叶斯分类算法和费歇尔判别函数的番茄病害识别技术;张飞云(张飞云等,2013)实现了基于K-means算法的玉米叶部病害图像自动分割的方法,能够有效提取叶片上的彩色病斑;Liu等(Liuetal.,2013)实现了一种基于多类RBFSVM的小麦叶部病害识别方法,获得了较高的精度;邵庆等(邵庆等,2013)实现了基于迭代阈值分割和微分边缘检测的小麦病害病斑切割的方法;温长吉等(温长吉等,2013)实现了基于神经网络的玉米病害图像分割技术,该神经网络通过改进的蜂群算法进行了优化;石凤梅等(石凤梅等,2013)实现了基于支持向量机的水稻稻瘟病彩色图像病斑的分割技术,实验结果说明该技术的分割效果优于常用的最大类间方差法;李旺(李旺等,2013)实现了基于支持向量机的黄瓜叶部病害识别算法,该算法对颜色、形状、纹理3种特征的识别精度达到了96.00%;2014年,张善文等(张善文等,2014)实现了一种以局部判别映射(LocalDiscriminantProjects,LDP)为理论基础的玉米病害识别方法,对5种玉米叶片病害图像数据库进行了分类实验,取得了较好的效果;濮永仙(濮永仙等,2014)实现了基于支持向量机的烟草病斑边缘检测技术,用来精确分割、提取叶片的病变区域;王美丽等(王美丽等,2014)在HSV颜色空间实现了对小麦白粉病和锈病病害图像自动识别,平均识别精度超过96%;2015年,许良凤等(许良凤等,2015)通过自适应加权算法实现了一种的玉米叶部病害分类器,其分类结果优于单一分类器策略。4 山东农业大学硕士论文1.3深度学习研究现状深度学习是机器学习的一部分,是人工智能、模式识别、神经网络、最优化等众多研究领域的交叉学科,其本质是通过若干非线性映射实现数据抽象化的多层次算法,它善于描述和挖掘众多变量之间潜在的复杂关系。对于深度学习的研究最早可以追溯到1980年KunihikoFukushima提出的新型认知机(Fukushimaetal.,1980),该认知机通过无监督学习实现了CNN的训练。1989年,YannLeCun等(Beckeretal.,1989)将反向传播算法应用到深度神经网络的训练算法中,实现了对邮政编码、金额数值等数字手写体的识别,但由于算法时间复杂度高,使得它难以在现实任务中推广和实施。与此同时,神经网络也受到了其他易于实现且效果较好的模型的冲击,支持向量机、朴素贝叶斯、K近邻、决策树等众多浅层学习模型迅速成为当时流行的机器学习算法,深度学习进入了低迷期。直到20世纪70年代,反向传播算法的出现让众多深度学习研究者看到了新的希望,他们试图通过该算法实现深度人工神经网络的无监督训练,但大多数的努力都失败了。研究人员认为失败的原因是“梯度弥散”现象,该现象多发生于多层前馈网络和递归神经网络的训练过程中,它是指在反向传播算法中,随着层数的增加,误差以指数级变换迅速减少,造成损失函数的权重更新导数越来越趋近于零,从而使网络整体学习过程非常缓慢,甚至达到肉眼无法分辨的静止状态,从而无法从训练样本中进行有效的特征提取和融合。直到2006年,加拿大多伦多大学的Hinton教授和他的学生共同解决了训练深度神经网络的问题,并根据研究内容在《科学》上发表了文献(Hintonetal.,2006)。文中一方面阐述了深度学习的概念,另一方面,为了解决深度神经网络的训练容易陷入局部最优值这一问题,Hinton先通过无监督预训练方法给出网络权值的初始值,再通过微调方法使权重参数向着全局最优解的方向接近,这种“逐层初始化”训练法有效克服了之前深度神经网络难以被训练的难题。这篇文章的发表开启了深度学习的时代,其在学术界、政府、媒体等多个领域迅速升温,获得了人们的广泛关注:2008年,NECLabsAmerican的研究员Collobert等(Collobertetal.,2011)将多层CNN应用于词性标注、分块、命名实体识别、语义角色标注等4个重要的自然语言处理问题中,并取得了较好的效果;2010年,美国国防部首次投资深度学习的研发计划,参与方还有纽约大学、斯坦福大学等多家知名校企(孙志军等,2012);2011年,微软研究院5 基于卷积神经网络的小麦叶部病害图像识别和谷歌的研究人员实现了基于深度信念网络的语音识别技术,这是十多年以来语音识别领域中的标志性突破;Collobert(COLLOBERTetal.,2011)实现了一种基于深度递归卷积图变换网络实现的自然语言解析判别算法;2012年,著名的默克药物生产公司将深度信念网络应用于药物活性的预测问题中,获得了当时最好的效果;2016年,科大讯飞公司实现了基于前馈型序列记忆网络的语音识别系统,击败了当时广泛使用的双向回复神经网络语音识别系统。从2006年到现在,深度学习已经成为众多科研领域中最先进的研究内容,深度学习不断发展,影响力不断提升,在各个领域中彰显自己独特的优势。1.4主要研究内容和论文结构1.4.1主要研究内容本研究以提高CNN对小麦叶部病害图像的分类精度为目标,重点从结构设计、学习过程以及参数优化等方面对网络模型进行分析、研究和改进,本文主要研究内容如下:(1)提出了一种基于细粒度差分放大卷积神经网络的小麦叶部病害图像识别算法。该模型具有卷积核矩阵和差分放大支路两点改进,前者有效地增加网络深度、神经元以及它们之间链接的数量,同时抑制了参数膨胀,且实现了来自不同滤波器的图像特征能够互相融合,后者能够放大真实输出与期望输出之间的微小差异,使权重更新对于每次迭代产生的反馈误差更加敏感,增加网络对于数据集的拟合能力,两者均使网络模型获得更高的识别精度。(2)提出了一种基于多道式卷积神经网络的小麦叶部病害图像识别算法。该模型允许网络中的低层下采样层与高层全连接层进行链接,从而实现了位于不同层次的图像特征的融合与利用,提高了分类精度。(3)提出了一种针对不平衡小麦叶部病害图像识别的CNN-LSVM模型。由于传统CNN在不平衡小麦叶部病害图像的分类中存在精度低、速度慢等,该模型将LSVM与CNN相结合,根据不平衡数据集的特点,设计代价敏感矩阵并对惩罚参数进行赋值,使模型对于因数据集的不平衡性导致的误分状况更加敏感,修正模型收敛走势,使其适用于不平衡数据集的分类。1.4.2论文结构本文共分为6章,章节安排如下:6 山东农业大学硕士论文第一章是绪论,首先介绍了本论文的研究背景和研究意义,然后综述了基于图像的农作物病害识别的国内外研究现状以及深度学习的研究现状,最后介绍了本文主要工作和章节安排。第二章主要介绍了CNN的理论,首先概括总结了它的发展过程和模型特点,然后详细阐述了网络模型的结构设计和训练过程。第三章提出了一种基于细粒度差分放大卷积神经模型,并将其应用到小麦叶部病害图像的识别中,本章首先介绍了模型设计,从理论上分析了卷积核矩阵以及差分放大支路对于CNN识别性能的提升,然后通过实验将改进模型的识别性能和传统分类算法做了对比分析。第四章提出了一种基于多道式卷积神经网络的小麦叶部病害识别方法,本章首先详细阐述了模型设计和训练过程,说明多道结构相较于传统串行网络结构的优势,然后将该模型与其它分类算法做对比实验。第五章提出了一种针对不平衡小麦叶部病害图像识别的CNN-LSVM模型,本章先对数据集的不平衡性进行了解释,然后根据存在的问题对模型结构进行了改进,最后介绍了数据的采集和预处理、实验设计和结果分析。第六章对全文研究内容的总结和对未来研究的展望。7 基于卷积神经网络的小麦叶部病害图像识别2卷积神经网络2.1卷积神经网络发展1962年,Hubel和Wiesel(Hubeletal.,1962)在对猫视觉神经皮层的研究中发现这些视觉神经只对图像的局部空间有反应,这为CNN的重要设计理念——局部感受野奠定了基础。1984年,Fukushima(Fukushimaetal.,1980)提出的神经认知机是CNN最早的实现形式,它只包含卷积神经元和采样神经元,分别用于提取图像特征和提高特征的鲁棒性,该神经认知机实现了数字手写体的自动识别,但精度一般。1989年,LeCun(Beckeretal.,1989)等人使用梯度寻优算法训练CNN,并实现了钞票金额和邮政编码等数字手写体识别的精确识别,在当时被广泛应用到美国的银行和邮局等机构。上述研究极大推动了CNN的发展,奠定了CNN的主要理论基础和设计理念,使得CNN具有自己独特的优势:CNN无须改变图像拓扑结构,而是在训练数据驱动下,通过多层非线性映射自适应地构建特征的隐式描述,并且特征提取和模式分类同时进行,避免了依靠先验知识设计的显式特征提取和数据重构环节,在模拟高度非线性关系和表示复杂函数方面,CNN比浅层学习具有更强的表征能力(LeCunetal.,1998;LeCunetal.,1989)。后期,人们在他们的研究基础上继续完善,实现了许多设计巧妙、功能强大的新型CNN模型,在步态识别、轨迹跟踪、目标检测、自然语言处理等多个领域中成绩显著:2012年,Krizhevsky(Krizhevskyetal.,2012)等人设计的AlexNet在ImageNet(Dengetal.,2009)举办的ImageNetLargeScaleVisualRecognitionChallenge(ILSVRC)中取得两个第一,其准确度超越第二名11%;2013年,MatthewZeiler(Zeileretal.,2013)等人通过反卷积技术实现了ZFNet,并获得了ILSVRC-2013的冠军;2014年,基于CNN实现的迄今为止最完善的人脸识别模型DeepFace(Taigmanetal.,2014)和DeepID(Ouyangetal.,2014)问世;以“godeeper”为设计理念的2种CNN模型GoogLeNet(Szegedyetal.,2015)和VGG(Simonyanetal.,2014)分别在ILSVRC-2014获取冠军和亚军;2015年,亚洲微软研究院研究设计的深度残差网络(Heetal.,2016)在ILSVRC-2015取得了冠军,其3.57%Top-5errorrate优于人眼的5.1%identificationerrorrate,说明它的物体识别能力已经超越人眼;2016年,DeepMind旗下基于蒙特卡洛树搜索算法、CNN和强化学习开发的智能机器8 山东农业大学硕士论文人“AlphaGo”击败了世界顶级围棋选手李世石(Silveretal.,2016);2017年,融合了深度强化学习的“AlphaGo2.0”击败了人类围棋第一人柯洁。2.2卷积神经网络特点CNN具有局域感受野、权值共享和下采样3个特点,3者使CNN具有以下优势:(1)局域感受野:局部感受野是指CNN中每一层输出特征图上的像素点在原始图像或者上层特征图中映射区域的大小。通过局域感受野,不同滤波器可以提取初级图像特征,例如圆度、角度、平滑度等。(2)权值共享:每个卷积核检测输入特征图上所有位置上的特定特征,且同一个输入特征图上的权重参数都是共享的,CNN通过权值共享极大减少了网络的参数总量,从而使得未来训练一些结构更复杂、规模更大的深度神经网络变得切实可行。(3)下采样:在下采样层,输入的特征图被均匀的网格划分为若干空间区域,然后取每个空间区域的平均值或最大值作为输出,这两种输出方式分别对应平滑池化(Avgpooling)和锐化池化(Maxpooling)。下采样增强了提取的图像特征对旋转、平移和缩放等变换的不变性,同时降低了网络参数,使得大规模的网络训练变得可行。2.3卷积神经网络拓扑结构从数据流角度来看,CNN分为输入层、特征提取和输出层3部分。从结构角度来看,CNN由一个或多个卷积层、池化层和全连通层组成,二维图像作为CNN的直接输入对象,网络中间段是由卷积层与池化层交替连接而成,输出层通常由全连接层和分类器组成,一个用于数字手写体识别的传统CNN结构如图1所示。C1:featuremapsS1:featuremapsC2:featuremapsS2:featuremapsC5:LayerF6:LayerOUTPUT6@28×286@14×1416@10×1016@5×5120@1×184@1×110@1×10167832×329GuassianConvolutionsSubsamplingConvolutionsSubsamplingFullConnectionFullConnectionConnections输入特征提取分类图1卷积神经网络结构Fig.1ThestructureofCNN9 基于卷积神经网络的小麦叶部病害图像识别从图1可以看出,该CNN结构包含3层卷积层、2层池化层和2层全连接层,输入的数字手写体图像大小为3232,分类结果对应于10种数字,有10类,为了提高识别精度或者满足特定任务的需求,还会在上述主要隐藏层中插入Dropout、局部响应归一化、局部对比度归一化和线性激活单元等多种辅助层。这种神经层的线性排列结构使得CNN能够直接从输入的图像中提取隐藏在深层的抽象特征,更有利于分类器对图像进行精确分类,与其他人工神经网络和算法相比,CNN在图像识别领域中显示出自己的独特优势。(1)卷积层卷积层是CNN的特征提取层,可视为模糊滤波器,增强原信号的同时,降低噪声,实现特征的强化和过滤。卷积层接收上一层特征图,用当前层的卷积核对其进行仿射求和,运算结果经过激活函数计算后得到该层的特征映射:mmyfu()jjmm1mmujxi*kijbj(2.1)iMj式中,mmy表示第m卷积层第j个卷积核的特征映射。u为第m层第j个卷积核的jj净激活,是上一层的特征图进行卷积运算与偏置参数mb之和。M为卷积层神经元的局jj部感受野,mmk为第m层第j个卷积核的第i个权值,b是第m层第j个卷积核的偏置ijj参数,“*”为卷积运算,f()为非线性激活函数,通常使用Sigmoid函数和Tanh函数。(2)下采样层下采样层利用局部相关性对上层的特征图进行聚合统计,减少特征维数,提高信噪比,整合某一区域内的局部特征以产生新特征。通过对该层中nn大小的池进行平滑池化或锐化池化等操作,使得提取的特征具有旋转、平移和扭曲鲁棒性,提高泛化能力和鲁棒性。对输入特征图的下采样提取如公式(2.2)所示:mmyfu()jj(2.2)mmm1mudown(x)bjjjjm式中,u为第m层第j个卷积核的净激活,是通过对上一层的特征图进行下采样jm加权,再加一个偏置参数b所得。f()为非线性激活函数,down()是下采样函数,j10 山东农业大学硕士论文mm为第m下采样层第j个卷积核的权重,M为下采样层神经元的局部感受野,b是jjj第m下采样层第j个卷积核的偏置参数。(3)全连接层对输入像素值进行光栅化,即将二维特征图转换成的一维特征队列,然后通过对输入信号的加权求和以及非线性激活函数的运算,得到全连接层的输出特征映射:mmyfu()(2.3)mmm1muxbmm1式中,u表示全连接层的净激活,通过对上层的输出信号x进行加权求和原mm酸,然后加上该层的偏置参数b得到的,f()为非线性激活函数,是全连接层的权m重参数,b是第m下采样层第j个卷积核的偏置参数。j(4)常见激活函数传统CNN多采用Sigmoid、Tanh等饱和非线性函数(saturatingnonlinearities)作为非线性映射的激活函数。I.Sigmoid函数Sigmoid函数是常见的S型生长曲线,常被用于生物学等其他领域中,由于其具有自身单调递增且反函数单调递增的性质,Sigmoid函数常被用作深度学习中的非线性激活函数,将变量映射到[0,1]之间。Sigmoid函数为:Sigmoid(α)1/(1e)(2.4)Sigmoid函数图像如图2所示:图2Sigmoid函数Fig.2SigmoidfunctionII.Tanh函数11 基于卷积神经网络的小麦叶部病害图像识别Tanh是双曲正切函数,是由双曲余弦函数和双曲正弦函数推导而来,经常出现在线性微分方程的求解过程中,也是CNN中传统的非线性激活函数。Tanh函数为:Tanh()(ee)/(ee)(2.5)Tanh函数图像如图3所示:图3Tanh函数Fig.3TanhfunctionIII.ReLU函数上面描述的Sigmoid函数和Tanh函数都是经典的非线性激活函数,但它们的梯度在饱和区域内变化缓慢,无限趋近于0,容易发生梯度弥散,严重增加模型收敛的时间复杂度,这种现象在深层网络尤为突出。为解决上述问题,加快网络训练速度,不饱和非线性函数ReLU成为CNN中的非线性激活函数,在保证神经元链接稀疏性的同时减少过拟合的发生。ReLU函数为:ReLU(x)max(0,)x(2.6)ReLU函数图像如图4所示。图4ReLU函数Fig.4ReLUfunction12 山东农业大学硕士论文相比较Sigmoid函数和Tanh函数,ReLU作为非线性激活函数能够取得更好的效果。第一方面,自身的线性非饱和性使计算量大幅减小,从实际实验角度来看,没有经过训练的ReLU就能达到甚至超过训练过的Sigmoid,甚至高于后者;第二方面,消除梯度弥散;第三方面,ReLU使部分神经元为零刺激,很好地模拟了生物神经的抑制性刺激,增加网络稀疏性,减少参数之间的依赖性和发生过拟合的概率;第四方面,ReLU本身的分段性导致其前传、反馈和求导都具有分段性,更容易优化学习,而Sigmoid和Tanh由于两端的饱和性,在学习过程中容易发生信号丢失。IV.ELU函数虽然ReLU因其能缓解梯度弥散现象而备受人们关注和使用,但随着网络深度、训练样本和迭代次数的增加,部分权重会陷入硬饱和区域,出现“神经元死亡”,严重影响模型收敛,ELU(ExponentialLinearUnit)被研究人员实现,成为目前被广泛应用的新的激活函数。ELU函数为zifz0ijk,,ijk,,ELU(i,j,k)z(2.7)(eijk,,1)ifz<0ijk,,z和a分别表示网络中第i个通道的j行k列的输入信号和映射信号,是根ijk,,ijk,,据先验知识定义的初始值。ELU的函数图像如图5所示:a-5-4-3-2azijk,,ijk,,-1-6-5-4-3-2-10123456z-1zijk,,a(e1)ijk,,-2-3-4-5图5ELU函数Fig.5ELUfunctionELU是Sigmoid和ReLU的结合,其左侧呈现软饱和性,右侧为无饱和性。右侧线性部分能够缓解梯度消失,并直接以监督的方式训练深层CNN,而无需依赖于无监督的逐层预训练。左侧软饱和性使输入的信号保证一定的信噪比。此外,ELU的平均13 基于卷积神经网络的小麦叶部病害图像识别输出接近于0,相比较Sigmoid、Tanh和ReLU其收敛速度更快,能够实现更高的分类精度。(5)局部响应和局部对比度归一化I.局部响应归一化LRN可以做到横向局部抑制,即对某一信号的左右邻域进行归一化处理。引入该层的动机在于模仿生物神经系统中的侧抑制机制,通过在局部区域中的神经元之间建立竞争机制,使得响应比较大的信号相对更大,提高网络的泛化能力。通道内部归一化方法的局部区域是在独立通道的内部空间扩展,接收到的每个信号都通过公式(2.8)归一化。min(N1,in/2)()i()i()2jyx/(k(/)n(x))(2.8)pq,pq,pq,jmax(0,in/2)()n式中,x表示网络中第n层特征图所对应(p,q)位置的输出信号,为缩放因子,pq,为指数项,n为归一化范围的局部尺寸大小,即公式(19)中求和区间的宽度。、和n一般被初始化为0.0001、0.75和5。II.局部对比度归一化LCN在同一特征图中的邻域像素间和不同特征图间的同一空间位置创建竞争,提高图像特征对于位移、缩放等操作的不变性,增加网络稀疏程度。LCN分为减性削减和除性削减。减性削减是指定信号的值减去邻域内每个像素加权后的值,权值通常由高斯加权窗来赋值,它是用来体现处于不同位置的信号其影响也不同。其公式如下:()k()k()kyxspq,pq,pq,NN()kspq,wxijij,,(2.9)ij11NNwij,1ij11x()n是第k个滤波器输出的特征映射,()k式中,s是神经元信号的加权求和,w表pq,pq,ij,示权重,N表示信号的数量。除性削减是先计算每个特征图中处在相同位置的局部特征的加权和,再计算所有特征图加权和的均值,然后每个特征图该位置的值被重新计算为该点的值除以均值,其公式如下:()nn()xa()npq,Lpq(,)y(2.10)pq,()nLpq(,)14 山东农业大学硕士论文()n()n()n式中,x表示网络中第n层特征图所对应(p,q)位置的输出信号,a和分pq,Lpq(,)Lpq(,)别表示局部区域L(p,q)的均值和方差。(6)DropoutDropout可以提高网络泛化能力,减少全连接层中的过拟合现象。在训练过程中,Dropout层会随机挑选某些神经元,阻止存在于连接到这些神经元路径上的滤波运算,以达到对它们的权值掩盖,被掩盖的部分神经元被暂时认为不包括在整个网络结构中,但该操作只是暂时的抑制,不是删除,被掩盖神经元的原始权重需要保留下来,因为下次迭代时它们可能会被激活,参与到整个网络结构的训练之中。Dropout处理前后的CNN结构如图6(a)和(b)所示。(a)Dropout之前的CNN结构(b)Dropout之后的CNN结构(a)ThestructureofCNNbeforeDropout(b)ThestructureofCNNafterDropout图6有无Dropout策略的神经网络结构Fig.6ThestuctureofCNNwithandwithoutDropout从图6(a)和图6(b)可知,当训练一个具有n个神经元的网络时,在加入Dropout之前,所有神经元在每次迭代中全部发挥作用,不仅费时,而且容易引发过拟合。在加入Dropout后,迭代之前,随机去掉每一特征映射中一半的神经元(Dropout率默认值为0.5),像这种每层特征映射中随机保留一半神经元的网络被称为“半数网络”。这时,n原始的网络可以看作是2种具有不同神经元和连接方式的模型的集合,迭代完成后,通过某种投票机制,对所有模型的处理结果进行整合,获得最终预测结果,而在迭代结束后,训练参数的总数还能保持不变,变相解决了费时问题。此外,Dropout降低了复杂神经系统中各个神经元之间的协同依赖性,因为在每次迭代训练中,部分神经元随机被掩盖,每个神经元无法一直依赖于其他固定的神经元,阻止了某些特征仅在其它特定特征出现时才会有作用的现象。因此,各个神经元15 基于卷积神经网络的小麦叶部病害图像识别被迫加强自身学习能力,从而提取层次更深、含义更抽象的特征映射,提高识别精度,避免过拟合的发生。通过一个服从伯努利分布(BernoulliDistribution)的函数对输入信号进行处理,以产生被Dropout处理过的信号,处理过程如图7(a)和图7(b)所示。(l1)Bias(l1)Biasbbii()lB3()l()ly()ly3y33()lB2()l(l1)(l1)f(l1)()l()lw(l1)y(1)lfy(1)ly2wiyiyiy2y2iii()lB1y()l()ly()l1y11(a)有Dropout的CNN训练过程(b)无Dropout的CNN训练过程(a)CNNwithoutDropout(b)CNNwithDropout图7有无Dropout策略的卷积神经网络训练过程Fig.7ThetrainingprocessofCNNwithandwithoutDropout从图7(a)可知,当网络中没有Dropout策略,训练过程为一般的前向传播算法,即()l(1)l先对输入信号y进行加权,再通过激活函数,对加上偏置参数后的过程信号y进行ii(1)l计算,得到该层的输出y。上述过程如公式(2.11)和公式(2.12)所示。i(1)l(1)l()l(1)lywyb(2.11)iiii(1)ll(1)yfy()(2.12)ii()l从图7(b)可知,当网络中有Dropout策略,上一层的输入信号y先与一个服从伯i()l()l努利分布的函数B相乘,从而获得进行掩盖之后的过程信号y,之后过程信号再通ii(1)l过加权、加偏置和非线性映射的计算,得到该层的输出y。上述过程如公式i(2.13)到公式(2.16)所示。()lB~Bernllioudistribution()p(2.13)i()ll(l)()yyB(2.14)iii(1)l(1)l()l(1)lywyb(2.15)iiii(1)ll(1)yfy()(2.16)ii(7)精度损失计算层精度损失计算层是用来计算CNN的分类精度、精度损失等指标,通常采用SoftmaxWithLoss作为该层的算法,该层也被称作SoftmaxWithLossLayer。该层是由16 山东农业大学硕士论文SoftmaxLayer和MultinomialLogisticLossLayer两部分组成,SoftmaxLayer主体为Softmax函数,MultinomialLogisticLossLayer主体为交叉熵代价函数。设输入信号为(,,...,zzz),每个信号z对应的类别为y,Softmax函数12m()((),zz(),...,z())z定义如公式(2.17)所示。12mexp()zi()z(2.17)imexp()zjj1该函数可将某一样本的线性预测结果转化为属于某一分类的概率。假设Tzzb为第i个样本的线性预测数值,Softmax先对每个z进行指数运算,再除以iiii所有项之和进行归一化,将线性预测结果转换成每一样本属于某一类别的概率。MultinomialLogisticLossLayer通过公式(2.18)计算()z最大似然结果。izymezlyz(,)log()loglogejz(2.18)yymzjej1j1精度损失计算层结构如图8所示。MultinomialLogisticFullyConnectedLayer-8SoftmaxLayerLossLayerz1exp()z()ziz1m2j1exp()zjmlyz(,)logezjzyj1exp()z()zikmj1exp()zjznSoftmaxRegration图8精度损失计算层Fig.8Precisionlosscalculationlayer分类精度是被正确分类的样本数与样本总数之比,如公式(2.19)所示。(_TPT_N)Accuracy(2.19)(_TPT_NFPF__N)17 基于卷积神经网络的小麦叶部病害图像识别式中,TP_=TruePositives,表示被正确预测的正类样本总数,TN_=TrueNegatives,表示被正确预测的负类样本总数,FP_=FalsePositives,表示被错误预测的正类样本总数,FN_=FalseNegatives,表示被错误预测的负类样本总数。2.4卷积神经网络的训练过程CNN的训练过程是一个“参数”向“函数”无限逼近的过程,该过程分为前向传播(FeedforwardPass)和反向传播(BackpropagationPass)两个部分。前向传播是指从输入层输入原信号开始,经过若干隐藏层的处理,最终从输出层输出的过程。反向传播是指将实际输出矢量与目标输出矢量的差值反向传送,从输出层到输入层的传播过程中,通过学习策略,更新网络结构中参数的数值,完善网络结构,不断迭代上述过程,直到达到最大迭代次数或者模型收敛为止。CNN训练过程如图9所示:通过某些策略对权重、偏置、阈值等参数随机设置初始值,对网络结构进行初始化更新权重、偏置、阈值等参数从训练集中随机选择部分样本作为输入,经过隐藏层,最终到达输出层并进行输出计算得到权重、偏置、阈值等参数的调整量将实际输出矢量与目标输出矢量不满足做差运算,得出差值并与阈值相比较,判断是否符合精度需求满足保存目当前的权重、偏置、阈值等参数模型收敛,训练结束图9卷积神经网络训练过程Fig.9ThetrainingprocessofCNN步骤1.模型开始训练前,随机初始化网络中的权值、偏置、阈值等参数。偏置一般初始化为1,权值通过公式(2.20)进行参数初始化。11WUniform(,)(2.20)NN式中,N是样本总数。18 山东农业大学硕士论文步骤2.从训练集中随机抽取部分样本进入输入层,并给出目标输出矢量,开始进行前向传播过程。步骤3.计算得出目标输出矢量,并与目标输出矢量比较,通过公式(2.21)计算它们之间的误差E。n112E()ammy(2.21)2m0式中,E是实际输出与目标输出的差值,误差,y是实际输出矢量,a是给定的mm目标输出矢量。通过公式(2.22)和公式(2.23)计算权值和阈值的更新量。Wn()(Wn(1)1)h(2.22)ioiooi1lO1ohi(1hi)oWio(2.23)m0式中,为学习速率,i表示隐藏层中的神经元,o表示输出层中的神经元,O表示输出层神经元总数,h表示隐藏层的输出,W表示权值矩阵,表示阈值。iioo步骤4.通过公式(2.24)判断输出是否达到精度标准E(2.24)式中,是误差地阈值,大于它则认为目前网络模型低于预期效果,返回步骤3继续迭代训练;小于它则结束训练,保存当前网络结构,认为分类器已经收敛。后期如果进行二次训练时,直接在保存下来的网络基础上进行,避免频繁初始化。2.5本章小结本章从发展历程、算法特点、拓扑结构和训练过程4个方面对CNN进行了详细的阐述,CNN能够直接从输入数据中提取抽象特征,实现精确、快速的模式识别,因其具有较好的实际应用效果而被广泛应用到多个领域中,因此,本文将CNN作为小麦叶部病害识别的理论基础,并对其进行改进,从而得到更高的识别精度。19 基于卷积神经网络的小麦叶部病害图像识别3基于细粒度差分放大卷积神经网络的小麦叶部病害图像识别3.1引言从近几年具有代表性的CNN模型的发展历程来看,通过隐藏层的线性叠加来提高网络性能是目前CNN的主要发展趋势:1980年,LeNet-5的前身Self-organizingneuralnetwork具有6层神经层;1998年,用于钞票手写体识别的LeNet-5具有7层神经层;在2012年至2015年期间被人们熟知的AlexNet,ZFNet,GoogLeNet,VGG和ResNet,他们的网络深度分别是8,8,19,22和152,尤其是ResNet,它比以往任何神经网络都深5倍以上,后期其研究人员甚至用超过1000层的ResNet去分析CIFAR-10。通过增加神经层的数量来提升挖掘到的图像特征的“等级”是共识。但目前大多数神经网络的神经层都是串行分布的,这种神经层线性叠加对于神经元之间链接数量的提升不明显,且不同滤波器之间没有联系,所提取到的图像特征不能较好的融合。此外,随着网络深度的增加,分类精度经过一段饱和期后会迅速下降,这种现象并不是由过拟合造成的,而是因为庞大的网络模型容易忽视较小的反馈误差,导致收敛率降低。针对上述2个问题,本章实现了F-gDACNN模型,并在在小麦叶部病害图像的分类识别中取得了较好的效果。3.2细粒度差分放大卷积神经网络为避免线性叠加隐藏层所带来的缺点,本章提出了F-gDACNN模型,它有2点改进:卷积核矩阵和差分放大支路,模型整体结构如图10所示:20 山东农业大学硕士论文CKM5:CKM6:CKM7:F:8F:9F:109@512@33()9@512@33()9@512@33()102420482048WWhheeaattleleaaffS:MaxS:MaxS:Maxddisiseeaasseeimimaaggee247Pooling,2/Pooling,2/Pooling,2/Conv1:Conv2:Conv3:Conv4:96@7796@77256@66256@66(S(Sizizee:2:25566225566))Convolutionallayer+ELUConvolutionallayer+ELUDropoutDropoutDropoutSubsamplinglayerLRNLRNFullyconnectedlayer+ELU图10F-gDACNN的结构Fig.10TheStructureofF-gDACNN从图10可以看出,F-gDACNN包含4个单一卷积层(Conv,Conv,Conv,123Conv),3个尺寸为33的卷积核矩阵(CKM,CKM,CKM),3个下采样层(S,45672S,S)和3个全连接层(F,F,F),每个卷积核矩阵都包含9个33大小的卷积层478910(Conv,Conv,Conv,Conv,Conv,Conv,Conv,Conv,Conv),为(0,0)(0,1)(0,2)(1,0)(1,1)(1,2)(2,0)(2,1)(2,2)创造生物神经系统的链接稀疏性,减少梯度弥散、过拟合的发生,在上述主要隐藏层中穿插ELU,LRN和Dropout作为功能层。3.2.1卷积核矩阵本文采用3个尺寸为33的卷积核矩阵(CKM,CKM,CKM)来代替传统CNN中567单个卷积层,每个卷积核矩阵都包含9个33大小的卷积层,每个卷积层中采用ELU作为非线性激活函数,图11描述了卷积核矩阵、传统CNN以及VGG的结构,并从神经元数量、神经元之间的链接数量以及所需训练的参数数量3个方面进行对比,说明卷积核矩阵在提高网络特征提取能力上的优势。21 基于卷积神经网络的小麦叶部病害图像识别b@aab@aaConvConvConvConvConvConv(0,0)(0,1)(0,2)(0,0)(0,1)(0,n-1)b@aaSize:LLb@2a2aConvConv(0,0)(0,1)b@aaConvConv(0,0)(0,1)ConvConvConvConv(1,0)(1,1)(1,2)(1,0)ConvConvInputImage(1,0)(1,1)Softmax,TanhConvConvConvELU(2,0)(2,1)(2,2)orReLUConvConv(n-1,0)(n-1,n1-)OriginalCNNSchemeVGGSchemeCKM-1SchemeCKM-2SchemeCKM-(n-1)图11卷积核矩阵的结构Fig.11Thestructureofconvolutionkernelmatrix假设输入图像尺寸为LL,传统的CNN(例如LeNet-5,AlexNet)是通过b个尺寸2为2a2a的卷积核实现特征提取,神经元数量为(L2a1)b,所需要训练的参数有222(4ab1)个,神经元链接数量为(L2a1)(4a1)b个,可见在传统CNN中,卷机窗尺寸较大,容易忽视关键的局部信息,且层数和神经元链接数量较少,图像特征的挖掘能力较弱。在ILSVRC-2014中获得亚军的VGG通过若干个较小的串行排列的滤波器来代替一个尺寸较大的滤波器,如SchemeVGG所示,通过两层尺寸为aa的卷积核(Conv(0,0),Conv(0,1))来代替OriginalCNN中22aa的卷积核,它的神经元数量为222bLa[(1)+(-2La2)],所需训练参数有2(ab1)个,神经元链接有222(ab1)[(L-a+1)(L-2a+2)]个,虽然SchemeVGG通过这种方式增加网络的特征提取能力,但这种简单的串行叠加无法明显地提高神经元链接数量,同时不同卷积核所学习到的图像特征也无法进行组合。针对上述缺陷,本文设计了卷积核矩阵,并在硬件能力允许的范围内实现了SchemeCKM-1和SchemeCKM-2所示的结构。在SchemeCKM-1中,22的卷积核矩阵是由4个相同的卷积层(Conv,Conv,Conv,Conv)组成,每个卷积层由(0,0)(0,1)(1,0)(1,1)b个尺寸为aa的卷积核组成,Conv,Conv与和Conv,Conv进行全连(0,0)(1,0)(0,1)(1,1)接,产生的4条数据流如表1所示:22 山东农业大学硕士论文表1SchemeCKM-1中的数据流Table1DatastreamsinSchemeCKM-1EndConvConv(0,1)(1,1)OriginConvConvConvConvConv(0,0)(0,0)(0,1)(0,0)(1,1)ConvConvConvConvConv(1,0)(1,0)(0,1)(1,0)(1,1)22SchemeCKM-1中的神经元数量为2[(bLa1)+(-2La2)],所需要训练的参数2222有4(ab1)个,神经元链接数量为4(a1)[(bLa1)(L2a2)]个。在SchemeCKM-2中,33的卷积核矩阵是由9个相同的卷积层(Conv,Conv,Conv,Conv,Conv,Conv,Conv,Conv,Conv)组成(0,0)(0,1)(0,2)(1,0)(1,1)(1,2)(2,0)(2,1)(2,2)的,每个卷积层由b个尺寸为aa的卷积核组成,Conv,Conv,Conv和(0,0)(1,0)(2,0)Conv,Conv,Conv和Conv,Conv,Conv进行全连接,生成的27条(0,1)(1,1)(2,1)(0,2)(1,2)(2,2)数据流如表2所示:表2SchemeCKM-2中的数据流Table2DatastreamsinSchemeCKM-2EndConvConvConv(0,2)(1,2)(2,2)OriginConvConvConvConvConvConvConvConvConv(0,0)(0,1)(0,2)(0,0)(0,1)(1,2)(0,0)(0,1)(2,2)Conv(0,0)Conv(0,0)Conv(1,1)Conv(0,2)Conv(0,0)Conv(1,1)Conv(1,2)Conv(0,0)Conv(1,1)Conv(2,2)ConvConvConvConvConvConvConvConvConv(0,0)(2,1)(0,2)(0,0)(2,1)(1,2)(0,0)(2,1)(2,2)ConvConvConvConvConvConvConvConvConv(1,0)(0,1)(0,2)(1,0)(0,1)(1,2)(1,0)(0,1)(2,2)Conv(1,0)Conv(1,0)Conv(1,1)Conv(0,2)Conv(1,0)Conv(1,1)Conv(1,2)Conv(1,0)Conv(1,1)Conv(2,2)ConvConvConvConvConvConvConvConvConv(1,0)(2,1)(0,2)(1,0)(2,1)(1,2)(1,0)(2,1)(2,2)ConvConvConvConvConvConvConvConvConv(2,0)(0,1)(0,2)(2,0)(0,1)(1,2)(2,0)(0,1)(2,2)Conv(2,0)Conv(2,0)Conv(1,1)Conv(0,2)Conv(2,0)Conv(1,1)Conv(1,2)Conv(2,0)Conv(1,1)Conv(2,2)ConvConvConvConvConvConvConvConvConv(2,0)(2,1)(0,2)(2,0)(2,1)(1,2)(2,0)(2,1)(2,2)SchemeCKM-2中的卷积核矩阵的神经元数量为22223[(bLa1)+(-2La2)(-3La3)],所需要训练的参数有9(ab1)个,神经元链接2222数量为27(a1)[(bLa1)(L2a2)(L3a3)]个。由上述对比可知,SchemeCKM-1和SchemeCKM-2中的卷积核矩阵结构能够较明显的提高神经元数量以及它们之间的链接数量,而需要训练的参数数量提升并不显著。后期在硬件条件允许的情况下,更是能够实现规模更大的类似于SchemeCKM-(n-1)的卷积核矩阵结构,其神经元数量,所需要训练参数的数量以及神经元链接的数量分别由公式(3.1)~(3.3)计算得到:23 基于卷积神经网络的小麦叶部病害图像识别222Num(n1)[(bLa1)(L2a2)...(Lnan)],Neu(3.1)nN3,4,...22Numtpna(1),bn3,4,....N(3.2)n2222Numna(1)[(bLa1)(L2a2)...(Lnan)],lc(3.3)nN3,4,...3从上述公式可以看出,矩阵规模n与神经元数量呈n关系,与它们之间存在的链接n22数量呈n关系,而与所需训练的参数数量呈n关系,说明矩阵规模的提高能够明显地增加神经元之间的链接数量以及神经元数量,而不需大量的训练参数去支撑网络,卷积核矩阵能够在实现抑制参数膨胀的同时,实现了更多的非线性映射,增加网络的拟合能力,且矩阵中不同卷积核提取到的特征能够自由组合,以产生更多新的图像特征,增加网络整体的学习能力和灵活性。3.2.2差分放大支路为了缓解深层网络对于迭代训练中反馈回来的微小误差的遗漏现象,本文在F-gDACNN中的3个卷积核矩阵前后各添加1条支路,以模拟差分放大器,实现误差放大的功能,在图12中将传统CNN的连接与差分放大支路结构进行对比,证明该结构在误差放大效果上的优势。CONn-1CONn-1CONn-3CONn-3ELUELUELUELUELULRNELULRNELUELUELUCONn-2CONn-2CONn-4CONn-4DropoutScheme1Scheme2图12差分放大支路结构Fig.12Thestructureofdifferentialamplificationbranch图12中的Scheme1是没有在深层网络添加branch的结构图,与传统CNN相似,它的数据流可由公式(3.4)表示:24 山东农业大学硕士论文Tl1E(wixlbl)(3.4)i其中,w和b分别是第l层神经网络的权重矩阵和偏置,x和T分别是第l层神llll1经网络的映射输入和映射结果,E()是线性激活函数ELU。图12中的Scheme2是在深层网络添加differentialamplificationbranch的结构图,它的数据流满足公式(3.5):HxFxwb(,,)l1lllllFxwb(,,)E(wx+),bl0,1,2,...,L(3.5)llllllli其中,w和b分别是第l层神经网络的权重矩阵和偏置,x和H分别是第l层神llll1经网络的映射输入和映射结果,F()是卷积层映射输出,E()是线性激活函数ELU。相l比较Scheme1的网络结构,该结构能够去掉不变的主体部分x,从而突出微小的变化lFxwb(,,),使网络能够对每次迭代产生的误差反馈更加敏感。假设输入的特征映射llll为100,它在CKM中的期望映射结果和实际映射结果分别为105和110,即5f(x)10565f(x)110,即f5,f和f分别表示CKM中的期望映射和实际映射,‘'’表656665x1005示在实际情况下的函数、变量等。在Scheme1中有,T5,T增加的输出所占比重为PTT/5/1050.0476,在Scheme2中有66T666,则Fxwb5(,55,)5E(wix5b5)5i,F55,F5增加的输出所占比重为Fxwb5(,55,)5E(wix5b5)10iPFF/5/51,Scheme2中的P远比Scheme1中的P大,因此Scheme2中Ff55F5T6的网络结构对于期望输出和实际输出之间存在的反馈误差更加敏感,实现了误差放大效果。在Scheme2中通过递归推导公式(3.6)能够得到公式(3.7):25 基于卷积神经网络的小麦叶部病害图像识别xl2xl1E(wi+1xl+1bl+1)=xlE(wixlbl)E(wi+1xl+1bl+1)(3.6)iiiL1xLx+lE(wixibi)(3.7)ili对于最初的输入x,第L层神经网络的映射结果为公式(3.8):0L1xLx+0E(wixibi)(3.8)ii0从公式(3.7)和公式(3.8)中可以看出,误差放大效果可以逐层积累,得到放大,从而使网络对于图像像素分布的拟合能力更强,最大程度上提高分类精度。3.3数据获取与预处理3.3.1数据获取在山东省境内的小麦种植基地和实验田中对济麦20号、烟农19号等小麦品种的发病叶部图像进行人工实地采集,采集工具为数码相机CanonEOS80D(18-200mm),拍摄图像格式为JPEG,24位图,图像数量为8326张,包含6类常见叶部病害以及正常叶片和机械损伤叶片,图像样例以及每类样本的数量和比例分布如表3和表4所示。表3小麦叶部病害图像样本Table3Samplesofwheatleafdiseaseimages正常叶片机械损伤白粉病细菌性条斑病小斑病条锈病叶锈病细菌性叶枯病26 山东农业大学硕士论文表4小麦叶部病害图像的数量和比例Table4Numberandproportionofeachcategoryofwheatleafdiseaseinoriginalimageset名称正常叶片机械损伤白粉病细菌性条斑病小斑病条锈病叶锈病细菌性叶枯病数量10161237118296210469391061883比例/%0.1220.1480.1410.1150.1250.1120.1270.1103.3.2数据预处理CNN自学习依赖于在大规模数据集上进行的迭代训练,数据量过小容易发生过拟合,使得训练误差很小,测试误差较大。为增加实验样本的规模和多样性,本文通过表25中的方法对小麦叶部病害图像进行图像增强。表25图像增强Table25Imageaugmentation名称具体操作噪声添加对原始图像添加了30%的高斯噪声,偏移量为0.2,标准差为0.3。Color将原始图像的色相,饱和度和明度各增加20%,对比度增加30%,锐度降低10%。jittering首先计算R,G,B三个颜色通道的均值和标准差,对网络的输入数据进行规范化,然后在训练集像素值的RGB颜色空间进行PCA降维,得到RGB空间的3个主方向向量p,p,p和3个特征值,,12312PCAjitteringTT3,再在图像的每个像素Ixy[IRxy,IGxy,IBxy]上加上[,ppp12,3][11,22,33],i是满足均值为0,差为0.1的随机变量。旋转模糊采用旋转对原始图像进行模糊,旋转模糊单元为10,用于模拟旋转移动相机的拍摄效果。采用缩放对原始图像进行径向模糊,缩放模糊单元为30,用于模拟前后移动相机的拍摄效果,达到类缩放模糊似放射一样的功能,实现自然补光。每种图像增强方法的处理效果以及增强数据集中每类样本的数量和比例如表6和表7所示。27 基于卷积神经网络的小麦叶部病害图像识别表6增强后的图像Table6Theimagesprocessedbydataaugmentation原始图像噪声添加ColorJitteringPCAJittering旋转模糊缩放模糊表7增强数据集中小麦叶部病害图像的数量和比例Table7Numberandproportionofeachcategoryofwheatdiseaseimageinaugmentedimageset正常叶细菌性条斑名称机械损伤白粉病小斑病条锈病叶锈病细菌性叶枯病片病数量50806185591048105230469553054415比例/%0.1220.1480.1410.1150.1250.1120.1270.1103.4实验设计与结果分析不同于支持向量机、全连接神经网络等其他一些传统的黑盒机器学习算法,CNN所提取的图像特征以及它们的滤波器都是可视的,这有利于人们对CNN工作原理的理解和下一步改进工作的进行。在实验的迭代过程中,F-gDACNN部分神经层的滤波器可视化结果如图13所示。28 山东农业大学硕士论文RedchannelPowderyConv(0,0)Conv(0,1)Conv(0,2)mildewConvConvConv(1,0)(1,1)(1,2)GreenchannelConvConvConv(2,0)(2,1)(2,2)BluechannelInputConv1S2CKM5F8OutLayer图13图像特征可视化.Fig.13Thefiltersofmainlayersvisualizedassmallimagespatches.(1)F-gDACNN与Lenet-5,AlexNet和ZFNet的对比实验为验证F-gDACNN的性能,将其与LeNet-5、AlexNet和ZFNet进行对比实验。LeNet-5包含3个卷积层,2个下采样层,3个全连接层;AlexNet和ZFNet均包含5个全连接层,3个下采样层,3个全连接层,区别在于前者用了两块GPU的稀疏连接结构,而ZFNet只用了一块GPU的稠密连接结构。4种模型在增强数据集上进行50,000次迭代,每5,000次迭代保存一次中间模型并对其进行验证,实验结果如图14所示:图14F-gDACNN,LeNet-5,AlexNet和ZFNet的分类精度Fig.14TheidentificationaccuracyofF-gDACNN,Lenet-5,AlexNetandZFNet29 基于卷积神经网络的小麦叶部病害图像识别从图14可以看出,当模型收敛后,F-gDACNN的平均分类精度在96.16%左右,高于AlexNet和ZFNet91.54%和92.79%的分类精度,明显高于LeNet-589.15%的分类精度,F-gDACNN对于增强后的小麦叶部病害图像具有较高的分类精度。(2)F-gDACNN-Softmax,F-gDACNN-SVM,F-gDACNN-KNN和F-gDACNN-Randomforest的对比实验该实验将F-gDACNN与Softmax,SVM,KNN和Randomforest4种分类器进行组合,观察它们对于扩增后的小麦叶部病害图像的识别精度变化走势,以研究不同分类器对于识别结果的影响。在KNN中,K100,SVM采用径向基核函数(RadiusBasisFunction,RBF),Randomforest中决策树的个数设为200,采用Gini指数,即c2GiniD()1pi,c8,表示数据集中类别的数量,pi表示i类样本数量在所有样本i中的比例。4种组合方案在增强数据集上进行50,000次迭代,每5,000次迭代保存一次中间模型并对其进行validation,4种方案的识别精度变化如图15所示:图15F-gDACNN-Softmax,F-gDACNN-SVM,F-gDACNN-KNN和F-gDACNN-Randomforest的分类精度Fig.15TheidentificationaccuracyofF-gDACNN,Lenet-5,AlexNetandZFNet从图15可以看出,当模型收敛后,F-gDACNN-SVM与F-gDACNN-Softmax的识别精度分别是95.82%和96.19%,明显优于F-gDACNN-Knn与F-gDACNN-Randomforest91.47%和90.06%的分类精度,并且通过实验过程可知,F-gDACNN-SVM在前期迭代次数较少时其识别精度高于F-gDACNN-Softmax,这是因为在前期实验中,迭代次数少,数据吞吐量小,而SVM是用结构风险最小化(StructureRiskMinimization,SRM)代替经验风险最小化(EmpiricalRiskMinimization,ERM)的基于统计学习理论的分30 山东农业大学硕士论文类算法,本身适用于小样本数据分类,所以在前期获得了比Sotfmax更高的识别精度。(3)F-gDACNN,KNN和SVM的对比实验为突出CNN在自动提取图像特征的优势,将F-gDACNN与KNN,SVM以及Randomforest做对比,3者分别在原始数据集和强化数据集上进行50000次迭代训练分类模型。KNN,SVM和Randomforest的处理对象是从颜色、纹理和形状3个方面对小麦叶部病害图像提取的49维特征向量,在KNN中,K100,SVM采用径向基核函数,惩罚参数C为10,gamma(g)为0.00010183,ζ为0.001,q为3,Randomforest中决策树的个数设为200,采用Gini指数。图像特征提取和实验结果如表8和图16所示。表8图像特征提取Table3.8Featureextractionofwheatleafdiseaseimages种类参数数量总数HSV颜色空间一阶矩灰度值(H,S,V)。3颜色特征6HSV颜色空间二阶矩灰度值(H’,S’,V’)。3RGB、HSV颜色空间θ=0°灰度共生矩阵中能量E、熵H、惯性矩I、相关8性C。RGB、HSV颜色空间θ=45°灰度共生矩阵中能量E、熵H、惯性矩I、相关8性C。纹理特征32RGB、HSV颜色空间θ=90°灰度共生矩阵中能量E、熵H、惯性矩I、相关8性C。RGB、HSV颜色空间θ=135°灰度共生矩阵中能量E、熵H、惯性矩I、相8关性C。Hu不变矩:m(1),m(2),m(3),m(4),m(5),m(6),m(7)。7面积(S)。1形状特征周长(L)。111圆度(C)。1复杂度(E)。131 基于卷积神经网络的小麦叶部病害图像识别图16F-gDACNN,SVM,KNN和Randomforest在原始数据集和增强数据集上的分类精度Fig.16TheidentificationaccuracyofF-gDACNN,SVM,KNNandRandomforestontheoriginalandaugmentedimageset从图16可以看出,对于4种算法在对原始数据集和强化数据集的分类实验中,F-gDACNN的分类精度明显高于KNN和SVM,这是由于F-gDACNN能够自动提取和组合图像深层次的抽象特征,不仅数量充足,而且更能揭示像素的真实分布,能够得到较好的分类效果。人工提取的特征数量有限,且位于图像浅层,表征能力不强,从而产生较低的分类精度。对于F-gDACNN本身,对强化数据集的识别精度高于对原始数据集的分类精度,这说明图像增强后的图像集能够使F-gDACNN提取到的图像特征具有对于旋转、平移、缩放、模糊等变化的鲁棒性,同时样本数量的增加也避免了Overfitting的发生,图像增强是必须的,它可以使样本的规模和密度更趋近于真实分布。3.5本章小结本章提出了一种基于F-gDACNN模型的小麦叶部病害图像识别方法,该模型有卷积核矩阵和差分放大支路2点改进:一是用若干小型卷积层组成的矩阵代替传统CNN中串行排列的卷积层,能够有效地提高隐藏层、神经元和神经元链接的数量,同时实现了不同滤波器中图像特征的融合,抑制参数膨胀地同时提高网络的学习能力;二是在较深的卷积层之间添加的支路能够放大真实输出与期望输出之间的微小差异,使权重更新对于每次迭代产生的反馈误差更加敏感,增加网络对于数据集的拟合能力,从而获得更高的识别精度。32 山东农业大学硕士论文4基于多道式卷积神经网络的小麦叶部病害图像识别4.1引言传统的CNN大多是串行结构的,其提取的浅层图像特征往往在参与一次迭代训练后就被抛弃,容易造成关键信息的丢失和浪费。研究人员对视觉区域显著性检测的研究结果表明,人类视觉系统习惯于先通过全局信息定位感兴趣.的目标区域,然后通过局部信息确定目标区域的具体对象。这种视觉习惯有利于提高生物视觉系统的识别性能。为了模拟这种视觉机制来提高CNN的感知能力,本章在传统CNN的结构基础上添加了2条支路,实现了MCNN,这种结构允许处于不同层次的图像特征的融合与重复利用,从而提高了对于样本关键信息的利用率。此外,为了防止过拟合、梯度弥散现象的发生,采用ReLU作为激活函数,并在主要隐藏层中引入LRN、LCN和Dropout,使网络结构更加完善。该模型在小麦叶部病害的识别中取得了较高的识别精度。4.2多道式卷积神经网络4.2.1多道式卷积神经网络的结构MCNN分为13层,分别是输入层(Input)、5个卷积层(C、C、C、C、C)、312345个下采样层(S、S、S)和个全连接层(F、F、F),中间穿插LRN、LCN、Dropout125678作为功能层,使网络整体更加完善。此外,为了模仿这种综合利用物体的浅层特征和深层特征进行观察的视觉习性,本文在神经网络整体为串行结构的基础上,加入两条支道,允许S层和S层提取的特征传递给F层,实现浅层特征与深层特征的融合利126用,重复提取关键信息。网络结构如图17所示。33 基于卷积神经网络的小麦叶部病害图像识别InputimageFeatureextractionClassification(256256)ReLUReLUReLUReLUReLUReLUReLU1234567F8C1S1C2S2C3C4C5S5F6F7OutputlayerConvolutedPooledConvolutedPooledConvolutedConvolutedConvolutedPooledmapsmapsmapsmapsmapsmapsmapsmaps123455diseasespeciesNormNormDropDrop1267Imagesof5maizeleafdiseasesFeedforwadpassBackpropagationpass图17MCNN结构Fig.17ThestructureofMCNN(1)卷积层彩色玉米叶部病害图像在Input层分为R、G、B三个分量输入,首先经过卷积层,即便原始图像经过去噪等预处理,图像本身还有存留部分不相关信息,为加强卷积层特征提取的能力,加强原始信息,同时抵抗噪声干扰,该模型建立了5个卷积层,并增加了每一卷积层上的神经元,以提高特征提取能力和抗噪声能力。本文设计的卷积层结构如表9所示。表9卷积层结构Table9Thestructureoftheconvolutionallayers名称C1C2C3C4C5Kernel_Size7755333333Kernel_Sum100256512512768Stride_Col22111Stride_Row22111Padding_Col01110Padding_Row01110Lr_weight01111Lr_bias02222Decay_weight01111Decay_bias00000Output_Sum100256512512768(2)下采样层34 山东农业大学硕士论文为加强下采样层更好地提取玉米叶部病害图像的有用信息,避免对输入特征降维时丢失关键信息,同时降低模型处理尺寸较大的玉米叶部病害图像(256256)的计算量,本章创新地采用重叠池化(OverlappingPooling)、最大池化(MaxPooling)和均方池化(L2Pooling)交叉组合的方案,用来增加下采样层的鲁棒性,同时抑制该层的过拟合现象。下采样层的结构如表10所示。表10下采样层结构Table10Thestructureofthesubsamplinglayer名称S1S2S5TypeL2poolingMaxpoolingOverlappingpoolingKernel_Size333322Stride_Col331Stride_Row331Padding_Col000Padding_Row000使用均方池化时,先求得池化区域内神经元信号值的平方和,再除以神经元总数即得该区域的输出值,过滤掉一些相关性低的信号。最大池化的滤波器尺寸等于步长,它是把将输入的特征图分割成互不重叠的矩阵,每个矩阵输出该区域的最大信号值,可减少上层计算复杂度,降低中间表达层的维度,使池化区域内具有较好的位移不变性(TranslationInvariant)。使用重叠池化时,滤波器尺寸大于步长,相邻的池化窗口会出现重叠区域,可对图像的抽象特征进行重复挖掘,有更大几率提取图像的重要信息,提高分类精度。均方池化能够减少因邻域大小受限造成的估计值方差增大,更好地保留叶片的整体特征,但不能细致提取图像细节信息,而最大池化可以减少因卷积层参数误差造成的估计值偏移,更多地提取叶片的纹理信息,弥补均方池化的缺陷。上述两种池化在抽象过程中会过滤掉不相关信息,但也同时会造成信息都丢失,而重叠池化可对玉米叶部病害图像的特征进行重复提取,有更大几率获取重要信息。通过3种不同池化方式的组合,能够更好地提取不同尺度图像的相同尺度信息以及同种尺度图像的多尺度信息,从而增加网络模型的普适度和鲁棒度。(3)全连接层由于输入的玉米叶部病害图像像素等级较高(256256),为提取在图像更深处的隐藏特征,增加实验的分类精度。本文构建3层全连接层,相比传统CNN增加1层,并增加每一全连接层上卷积核的数量,3层全连接层的具体结构如表11所示。35 基于卷积神经网络的小麦叶部病害图像识别表11全连接层结构Table11Thestructureofthefullyconnectedlayer名称F6F7F8TypeInner-productInner-productInner-productKernel_Size111111Kernel_Sum112410242048Stride_Col111Stride_Row111Padding_Col000Padding_Row000Lr_weight115Lr_bias2210Output_Sum112410242048由于S1层、S2层和S5层提取到的特征传递给F6层,F6层的特征维度为3个下采样层特征维度之和,即在F6层中1124个图像特征。F8为输出层,在特征提取完毕后,以全连接方式与分类器链接,输出最终的分类结果等其它信息。本文将改进的CNN分别链接Softmax和SVM两种分类器,以观察2种方案的实际效果。(4)归一化层由于不稳定的采集环境和玉米叶部病害的多样化外观,图像像素值值域跨度大,直接输入会加重网络计算量。并且值域范围大的信号在模型学习中的作用会偏大,范围小的信号作用会偏小,影响模型生长走势。此外,输出层的激活函数值域是有限的,还需要将输入数据映射到激活函数值域中。为解决上述问题,本文建立2个归一化层,并同时引用局部响应归一化(LocalResponseNormalization,LRN)和局部对比度归一化(LocalContrastNormalization,LCN)。两种归一化方法在改进的CNN中的分布如表12所示。表12归一化层Table12NormalizationLayer名称NormNorm12TypeLRNLSN将两者同时应用到CNN中,在发挥各自作用的同时互相弥补。LRN的作用区域为独立通道内,位于不同通道的信号无法建立联系,而LCN可以使处于不同特征图的信号对同一空间位置进行竞争,做到了独立通道之间的联系。同时,LRN能加强图像中重要信号的强度,但自身没有机制去限制该加强作用,LCN能够削弱过大数值,将信号强度缩小到一定范围内,减少网络计算量。(5)不完全连接机制36 山东农业大学硕士论文为模仿生物神经系统中连接稀疏性的特点,同时减少网络参数数量,破坏模型对称性,使提取的特征尽早具有一定的互补性和突变性,本文在改进CNN中的S1层和C2层之间采用不完全连接机制。根据非对称性原则和交错性原则,本文制定了3种不同的连接规则:(1)C层的前100个图像特征,每一个图像特征依次与S层中连续的50个图像特21征连接。(2)C层从第101个到第200个图像特征,每一个图像特征依次与S层中连续的2151个图像特征连接。(3)C层的后56个图像特征,每一个图像特征依次与S层中的100个图像特征进21行全相连。S与C的不完全连接规则如表13所示。12表13S1层与C2层之间的不完全连接规则Table13IncompleteconnectionrulesbetweentheS1layerandtheC2layerC2S1123…4950515253…99100101102103…199200201…2552561×××××××××××2××××××××××××3×××××××××××××…49×××××××××50××××××××××××51×××××××××××52××××××××××53×××××××××…99×××××××××100××××××××××注:×是已连接的神经元由表13的第2列可知,C层第1个图像特征与S层第1到第50个图像特征连21接,即通过卷积运算对S与C层中相连接的部分区域进行操作,经转换函数后得到C122的输出信号。4.2.2多道式卷积神经网络的训练过程与上述MCNN结构相对应,本节给出了该模型的训练过程,它可以分为MCNN前向传播(MultichannelConvolutionalNeuralNetwork-FeedforwardPass,MCNN-FP)和37 基于卷积神经网络的小麦叶部病害图像识别反向传播(MultichannelConvolutionalNeuralNetwork-BackpropagationPass,MCNN-BP),两者交替运行,直到模型收敛或迭代达到最大值。训练过程如图18所示。对权重、偏置、阈值等网络参数进行初始化MCNN-FPMCNN-BP误差小于阈值或者达到最大迭代次数否是保存目前的MCNN网络结构模型收敛,训练结束图18MCNN的训练过程Fig.18ThetrainingprocessofMCNNnnnn假设共有N个训练样本,第n个输入样本为x(,xx,...,x),对应的实际输出12mnnnnnnnn向量和期望输出向量分别为y(yy,,...,y)和EO(EOEO,,...,EO),优化目标12c12c为所有样本的均方误差函数:NcN1nn2E()ymmEO(4.1)2nm11(1)MCNN-FP前向传播是从输入玉米叶部病害图像的R、G、B三个分量开始,经过卷积层、下采样层等隐藏层的计算,最终得到实际输出的过程。前向传播具体过程如图19所示。38 山东农业大学100硕士论文CCnf(xWn1,ib1,i),1i10011,ii1Snn11S1,idown(,)pq(C1,i),1i100256nn2,i2,iC2C2,iif(S1,Wb),1i256i1nn2S2S2,idown(,)pq(C2,i),1i256512nn3,i3,iC3C3,iif(S2,Wb),1i512i1512nn4,i4,iC4C4,iif(C3,Wb),1i512i1768CCnf(CnW5,ib5,i),1i76855,ii4,i1Snn5Sdown(C),1i76855,i(,)pq5,innnnF(S,S,S),1i1124F6,i1,(1,2,...,100)2,(1,2,...,256)5,(1,2,...,768)6nn77FfF(Wb),1i1024F7,ii6,7nn88FF8,iifF(7,Wb),1i1008图19MCNN前向传播算法Fig.19MCNN-FPnn其中,C表示第x个卷积层的第i个卷积面,S表示第x个下采样层的第i个下xi,xi,nxi,xi,采样面,F表示第x个全连接层的第i个全连接面,W和b分别表示第x个卷积层xi,或下采样层的第i个权重矩阵和偏置参数,f为非线性激活函数,本文采用的线性修正x单元ReLU,即ReLUx()max(0,)x,down为第x个下采样层中卷积窗口大小为(,)pq123pq的下采样函数,其中,down(3,3)为重叠池化,down(3,3)为最大池化,down(2,2)为均xx方池化,W和b分别表示第x个全连接层的权重矩阵和偏置参数。(2)MCNN-BP在反向传播过程中,主要任务是误差反馈,即在输出层得到实际输出与期望输出的差值,然后逐层反向传输,直到输出层为止。误差反馈具体过程如图20所示:39 基于卷积神经网络的小麦叶部病害图像识别Cn(ynEOn)fF(n)188,iSnn(Wi8T),1102417,F8Cnn(Wi7T),1112426,F7Snnnn(,,...,,),1i76825,,Si5,,1S5,,2S5,,768Sn1nnC35,,CifC(5,i)up(,)pq(5,,2S),1i768pqnn5,inC44,,Ci(5,,CiW)C4,i,1i512nn4,in(W)C,1i512C3,,Ci4,,Ci3,i5nn3,in(W)S,1i2562,2,Si3,,Ci2,innnS52,,Si(2,1,Si2,2,Si),1i256nnnn(,,...,),1i2562,1,Si2,1,1S2,1,2S2,1,256Sn1nnF62,,CifC(2,i)up(,)pq(2,,Si),1i256pqnn2,in(W)S1i1001,2,Si2,,Ci1,innnF71,,Si(1,1,Si1,2,Si),1i100nnnn(,,...,),1i1001,1,Si1,1,1S1,1,2S1,1,100Sn1nnF81,,CifC(1,i)up(,)pq(1,,Si),1i100pq图20MCNN误差反馈Fig.20Theerrorfeedbackprocessnn其中,表示第l个全连接层的第i个全连接面的反馈误差,表示第l个下采lFi,,lSi,,n样层的第i个下采样面的反馈误差,表示第l个卷积层的第i个卷积面的反馈误差,lCi,,nnn特别的,和均由两部分构成,一部分是分别来自C3和C2的反馈误差和2,,Si1,,Si2,2,Sinnn,另一部分是来自F6的反馈误差和。符号表示矩阵或者向量的对应1,2,Si2,1,Si1,1,Si元素相乘,f为非线性激活函数的导数,up()卷积窗口大小为pq的上采样函(,)pq数。在误差反馈过程中,每一隐藏层计算得到目标函数关于权值、偏置的偏导数,然后根据随机梯度下降法(StochasticGradientDescent,SGD)更新网络参数,整个过程即是反向传播。卷积层、全连接层求得目标函数对权值和偏置的偏导数如公式(4.2)所示。40 山东农业大学硕士论文NNEOnnEOnxi,,Inputx1,ixi,,xixi,Wbnn11(4.2)NNEOnTnEOnxx(Inputx1)x,xWbnn11EOEO式中,是卷积层中目标函数关于权值的偏导数,是卷积层中目标函数xi,xi,WbEOEO关于偏置的偏导数,是卷积层中目标函数关于权值的偏导数,是卷积层中目xxWbn标函数关于偏置的偏导数,Input是第x个卷积层上一层中第i个特征映射的输入,xi1,nn是第x个卷积层上一层中第i个特征映射的反馈误差,Input是第x个全连接层上xi,x1n一层的输入,是第x个全连接层上一层的反馈误差。x4.3实验设计与结果分析实验采用3.3节所描述的图像数据集,神经网络的参数通过随机梯度下降法进行更新,图21展示了训练过程中在C,C,C,C和C中所提取的图像特征。12345(a)原始图像(b)C(c)C12(d)C(e)C(f)C345图21图像特征可视化Fig21VisualizationoffilteredoutputimagesinthefiveconvolutionallayersduringthelearningprocessofMCNN(1)有无预训练模型两种训练方案的对比本文对MCNN进行训练,先采用源于ImageNet的ImageNetLargeScaleVisualRecognitionChallenge12的大规模图像集合进行模型的预训练,再采用玉米叶部病害图41 基于卷积神经网络的小麦叶部病害图像识别像,对预训练完毕后模型进行二次训练,实验表明,采用预训练机制能够明显加快模型的收敛速度。图22是有无预训练模型的两种训练方案的分类精度随迭代次数的变化。图22两种训练方案的分类精度变化Fig.22Accuracyoftwotrainingschemeswithnumberofiterations从图22可知,当迭代次数均达到10000次时,在预训练模型的基础上学习得到的网络结构,其分类精度已达到91.92%,相比较原始精度22.38%有着明显的提升,精度损失也从最初的1.613090降低到0.541345。而没有预训练模型,直接随机抽取玉米病害图像进行学习得到的网络结构,其分类精度只有23.24%,精度损失为1.61434,两个指标均未得到明显的改善,由此可知,要想达到理想的分类精度和精度损失,没有预训练模型的训练方案还需要大量的迭代次数,严重损耗时间、物力和人力。可以看出,基于ImageNet图像大数据集产生的预训练模型的参与,能大幅度加快网络的训练速度。(2)对预处理前和预处理后的图片进行对比实验虽然CNN本身具有一定的鲁棒性,它可以通过卷积运算提高信号强度,降低噪声比重,图像中的小部分噪声并不会对实验结果造成过多影响,但当训练图像集合的规模较大时,噪声的干扰会在网络的学习过程中得到积累,影响模型的学习走势,并且消耗训练时间。本文采用的玉米病害图像是经过去噪、切割处理后的图像,相比较原始图像的实验结果,具有较明显的改善。图23是MCNN对预处理前后的两组玉米病害图像的实验结果。42 山东农业大学硕士论文图23MCNN对原始图像集和标准图像集的分类精度Fig.23AccuracyofMCNNonstandarddatabaseandoriginalimages与原始图像相比,对于标准数据集的识别精度随着迭代次数的增加更加明显,因为CNN本身的鲁棒性是有限的,较少的图像噪音对识别结果没有有显著的影响,然而,当训练集的规模较大时,学习过程会积累噪声的干扰,这会误导模型的增长,因此,图像预处理是提高识别精度的必要条件。(3)MCNN与LeNet-5的对比实验为验证MCNN在隐藏层层数、神经元个数等方面上的优势,将其与经典的LeNet-5进行对比实验。LeNet-5共有6层隐藏层,分别是2层卷积层、2层下采样层和2层全连接层,分类器为Softmax。图24为MCNN与LeNet-5对小麦叶部病害图像的处理结果。43 基于卷积神经网络的小麦叶部病害图像识别图24.MCNN和LeNet-5的分类精度Fig.24AccuracyofMCNNandLeNet-5throughtheiterations从图24可以看出,当迭代次数均达到10000次时,改进CNN的分类精度为93.45%,精度损失为0.541345,LeNet-5的分类精度为78.84%,精度损失为58.63600,改进CNN的分类精度优于LeNet-5。并且从变化趋势上可以看出,随着迭代次数的增加,改进CNN的分类精度稳定提升,精度损失平稳下降,说明网络结构趋于收敛,而LeNet-5的准确率跳跃式提升,精度损失也出现明显的峰值现象,网络结构并不稳定。由此可见,当迭代同样次数时,改进CNN相比较LeNet-5,分类精度高,精度损失低,实验效果优秀,体现出更深层网络结构对于深层特征具有更强的提取能力。(4)MCNN-Softmax与MCNN-SVM对比实验本文通过在网络的全连接层后链接Softmax和SVM两种不同的分类器,来比较两者的分类效果。图25为2种模型对预处理前后的图像的分类状况。44 山东农业大学硕士论文图25MCNN-Softmax和MCNN-SVM的分类精度Fig.25AccuracyofMCNNwithSoftmaxandSVM从图25可以看出,当迭代次数达到10000次时,Softmax分类器与SVM分类器所得到的分类精度基本接近。但从实验过程中可以看出,在迭代次数小于4000时,SVM分类器的分类精度优于Softmax分类器,大于4000后,2者分类精度才基本持平,只会出现预算中的浮动现象。这是由于前期迭代次数少,网络正处理自我学习的初期阶段,整体结构不稳定,此外,数据的吞吐量少,Softmax不能从小样本中得到较好的分类效果,而SVM将结构化风险最小化代替传统的经验风险最小化,通过max-margin理念的支撑,能对数据的分布进行结构化描述,因此,算法本身减轻了对于数据规模和数据分布的要求,从而获得较好的泛化能力,即使是在前期接触数据少的情况下,也能得到比Softmax优秀的分类结果。当迭代次数继续上升,网络结构趋于稳定,数据吞吐量足够大,Softmax分类器与SVM分类器的分类精度基本持平。(5)MCNN与浅层学习算法KNN、SVM的对比实验为突出深度学习相比较传统浅层学习在提取深层隐式特征的优势,将MCNN与KNN、SVM算法作对比,观察3者的分类精度。KNN与SVM的处理对象是人工提取的显式图像特征,本文从颜色、纹理、形状3个角度对小麦病害图像提取49条图像特征,包含6条颜色特征、32条纹理特征、11条形状特征。具体的特征提取信息如表14所示。此外,SVM采用径向基核函数,惩罚参数C为10,gamma(g)为0.00010183,ζ为0.001,q为3。45 基于卷积神经网络的小麦叶部病害图像识别表14图像特征提取Table14Featureextractionofmaizeleafdiseaseimages种类参数数量总数HSV颜色空间一阶矩灰度值(H,S,V)。3颜色特征6HSV颜色空间二阶矩灰度值(H’,S’,V’)。3RGB、HSV颜色空间θ=0°灰度共生矩阵中能量E、熵H、惯性矩I、相关8性C。RGB、HSV颜色空间θ=45°灰度共生矩阵中能量E、熵H、惯性矩I、相关8性C。纹理特征32RGB、HSV颜色空间θ=90°灰度共生矩阵中能量E、熵H、惯性矩I、相关8性C。RGB、HSV颜色空间θ=135°灰度共生矩阵中能量E、熵H、惯性矩I、相8关性C。Hu不变矩:m(1),m(2),m(3),m(4),m(5),m(6),m(7)。7面积(S)。1形状特征周长(L)。111圆度(C)。1复杂度(E)。1MCNN与KNN、SVM对于预处理前后的2类玉米病害图像的分类精度如图26所示。图26MCNN、SVM和KNN对于标准数据集和原始数据集的分类精度Fig.26Identificationresultsonthestandarddatabaseandoriginalimages从上图可以看出,对于预处理后的玉米病害图像,MCNN分类精度相比较KNN、SVM两种浅层学习方法具有小幅度提升,但对于原始图像,MCNN的分类精度具有明46 山东农业大学硕士论文显的提高,原因是网络本身可自动挖掘抽象特征,同时卷积运算能增强信号,降低噪声干扰,而下采样层使提取到的特征具有对平移、旋转等操作的不变性,增加其鲁棒性,而KNN、SVM缺乏对背景噪声的分辨能力,将噪声部分当作有用信息加入到有监督识别的过程中,从而影响分类精度。但是,CNN的抗干扰能力也是有限的,在处理大部分都存在弥散、反光、过多不相关噪声区域的原始图像时,随着迭代次数的上升,噪声的影响会在学习过程中积累,当达到一定程度时,也会影响模型的训练方向和最终的分类结果。4.4本章小结本章介绍了一种基于MCNN的小麦叶部病害识别的方法。受生物视觉习性的启发,在传统串行结构的CNN基础上,设计并实现了一种多道式卷积神经网络,该结构使得处于高低不同层次的图像特征能够互相融合,实现了对关键信息的重复利用。后期将其与LeNet-5、SVM和KNN等算法进行了小麦叶部病害识别的对比实验,结果表明,该模型相比其他算法具有较高的分类精度。47 基于卷积神经网络的小麦叶部病害图像识别5基于CNN-LSVM模型的不平衡小麦叶部病害图像识别5.1引言近几年CNN在人脸识别、步态跟踪等图像识别领域中效果显著,但它无法较好地对不平衡数据集进行分类识别。不平衡数据普遍服从长尾分布,即大量样本的种类较少,只包含几类甚至一类,剩余的少量样本种类却包含多个种类,这种现状在小麦叶部病害图像中也存在:一方面,由于气候、土壤以及致病机理的差异,不同病害的发病规模不一样,导致每种病害图像的数量各不相同;另一方面,同种病害的发病程度和不同病害的病征外观参差不一,外加采光、水雾、采集设备抖动等不相关噪声的影响,使同种病害图像的特征向量在空间分布中的稀疏稠密程度差异很大。两方面均造成了作物病害图像的不平衡性,对于全监督训练的CNN影响很大。此外,网络模型是在大规模数据集上训练得到的,样本的局部信息容易被忽视。针对上述问题,本章引入LSVM作为分类器,并结合不平衡数据和实际应用场景对算法的权重更新策略、损失函数等进行改进,将其与CNN融合,实现一种CNN-LSVM模型,该模型根据不平衡数据集的特点,设计了代价敏感矩阵,并通过它对优化目标函数中的惩罚参数进行赋值,使模型对因数据集的不平衡性导致的误分状况更加敏感,及时修正模型收敛走势,使其适用于不平衡数据集的分类。CNN与LSVM的有机结合,获得了比传统CNN以及浅层学习算法更高的分类精度和分类效率。5.2CNN-LSVM模型5.2.1小麦叶部病害图像的不平衡性小麦叶部病害图像的不平衡性主要表现在样本的数量和特征空间的分布。(1)受当地气温、降水、土壤和施药等因素的影响,不同种类的小麦叶部病害的发病规模也各不相同,导致了采集到的各类小麦叶部病害图像在数量上呈现出明显的差异。(2)同种病害图像的特征向量在空间中的分布也各不相同,这是不平衡性的另一表现。由于众多致病机理的差异,以及在采集图像时受到光照不均、阴影遮挡、设备抖动等因素的影响,小麦图像的像素分布和信号强度差别较大。这种空间分布的复杂度是广义的,它具体包含重叠、缺少代表样本、类间分离程度小等,如图27所示:48 山东农业大学硕士论文C:多数类的重叠样本D:少数类的分离项A:一般的多A:一般的多数类数类22ffB:一般的少B:一般的少数类数类C:噪声F:噪声E:多数类的分离项f1f1(a)数量上的不平衡性(b)特征空间分布中的不平衡性(a)TheImparityofQuantity(b)Disequilibriumofquantityandspatialdistribution图27小麦叶部病害图像的不平衡性Fig.27Imbalanceofwheatleafdiseaseimages图27(a)和(b)中,红色圆和蓝色圆分别代表少数类和多数类,两图中的样本都存在不平衡性。图27(a)是数量上的不平衡,蓝色样本的数量明显比红色的多;图27(b)既有数量上的不平衡,也有空间分布上的不平衡,例如重叠样本和子聚类,这些分离项由于缺乏代表样本,使自身难以被分类模型关注和学习,导致分类精度下降。5.2.2CNN-LSVM的结构设计针对不平衡小麦叶部病害图像的分类,本文设计并实现了CNN-LSVM模型,从学习过程上可分为Input、FeatureExtraction和Classification,FeatureExtraction分别在GPU和GPU上同时进行,从结构上可分为CNN和LSVM。CNN-LSVM的整体结构如12图28所示。49 基于卷积神经网络的小麦叶部病害图像识别本本本Inp文utFeaturee文xtractionClassif文icationGPU1ReLU1ReLU2ReLU3ReLU4ReLU5ReLU6ReLU7FF67C:96@77C:256@55C:512@33C:512@33C:512@3310241024123451CWWhheeaattleleaaff22ddisiseeaasseeimimaaggeeS:96@33S:256@33S:512@2231254S:96@331S:256@332S:512@2255(S(Sizizee:2:25566225566))6C27C:96@771C:256@552C:512@33C:512@33C:512@338345FirstcategorySecondcategoryThirdcategoryNormalizationNormalization12DropDrop67GPU2本本CN文NHLSV文M图28CNN-LSVM的结构Fig.28ThestructureofCNN-LSVM(1)InputCNN-LSVM模型的输入层,先对小麦叶部病害图像进行零均值化(MeanSubtraction),即把图像的每一维特征都减去平均值,以实现特征维度的中心化,再将其分为R、G、B3信道进行输入,每次批处理100张图像。(2)FeatureExtraction主体为CNN,负责对小麦叶部病害图像的特征提取。分为10个隐藏层,分别是5个卷积层(C,C,C,C,C)、3个下采样层(S,S,S)和2个全连接层(F,123451236F)。为模仿生物神经系统的链接稀疏性,避免梯度弥散、过拟合等问题的发生,在上7述主要隐藏层中穿插ELU、归一化层、Dropout层等若干功能层,进一步完善网络结构。I.卷积层卷积层通过局部连接和权值共享来模拟具有局部感受野的简单细胞。在卷积层中,上一层的图像特征被若干可学习的卷积核进行卷积,再通过激活函数计算得到输出图像特征,每个图像特征可以组合成新的图像特征。考虑到小麦叶部病害图像相比人脸、指纹图像更加复杂,同时为了提高卷积层的特征提取能力,加强信噪比,本文建立了5个卷积层,并增加每一卷积层上神经元的数量,卷积层结构如表15所示。50 山东农业大学硕士论文表15卷积层结构Table15Thestructureofconvolutionallayer名称C1C2C3C4C5Kernal_Size7766333333Kernal_Sum1002565127681024Stride_Col22111Stride_Row22111Padding_Col01110Padding_Row01110Lr_weight01111Lr_bias02222Decay_weight0.0051111Decay_bias0.0050.0050.0050.0050.005Momentumcoefficient0.90.90.90.90.9Output_Sum1002565127681024从表15可以看出,随着卷积层数的增加,卷积核的尺寸在减小,数量在增加,这是为了更充分地抽取图像深层的细粒度特征。Stride是滤波器在水平和竖直方向上的移动步长,它影响得到的图像特征的数量。Padding是在水平和竖直方向上加在滤波器边缘的0的数量,为了能保证图像的宽度能被滤波器的尺寸整除。Lr_weightandLr_bias分别代表权重和偏置的学习率,他们影响在优化过程中参数的寻优速率。Decay_weightandDecay_bias分别代表权重和偏置的衰减速率,可减少过拟合的发生。Momentumcoefficient相当于阻尼项,它降低了网络对于误差曲面局部细节的敏感性,有效抑制局部最优,以起到减少学习振荡趋势、改善模型收敛过程的效果。II.下采样层池化层模拟复杂细胞将初级视觉特征筛选并组合成更高级、抽象的视觉特征的过程,越高级的特征越能体现人类的语义信息。通过池化层的下采样后,输出特征图的数量不变,尺寸变小,可以减少计算复杂度,同时维持图像特征对于缩放、位移和扭曲等变换的局部不变性。为避免下采样层对输入特征进行降维时丢失关键信息,抑制该层的过拟合,本文交替采用MaxPooling和MeanPooling对不同位置的特征进行聚合统计,缩放因子为2。下采样层结构如表16所示。表16下采样层结构Table16ThestructureofSubsamplinglayer名称S1S2S5TypeMeanpoolingMaxpoolingMeanpoolingKernal_Size22332251 基于卷积神经网络的小麦叶部病害图像识别Stride_Col331Stride_Row331Padding_Col000Padding_Row000Momentumcoefficient0.90.90.9Output_Sum1002561024MaxPooling和MeanPooling的滤波器尺寸等于步长。输入的特征图首先被分割成互不重叠的矩阵,然后每个矩阵输出该区域对应的最大信号值和平均信号值,从而选出局部感受野中具有代表性的特征,降低中间表达层的维度,使降维后的特征具有较好的translationinvariant。此外,为避免梯度弥散的初选,CNN-LSVM采用ReLU作为激活函数,且分别在在2个归一化层Normalization,Normalization引入LRN来减少过拟合的发生。12(3)ClassificationClassification包括2个全连接层和LSVM作为分类器,其主要任务是根据CNN提取的图像特征对小麦叶部病害图像进行分类。由于LSVM在处理大规模的不平衡数据集时存在算法时间复杂度高、分类精度低的问题,本文针对上述两点进行改进。I.全连接层全连接层用于计算输入向量和权重向量的点积,实现二维图像特征的光栅化,得到的激活值即CNN提取到的图像特征。由于输入的小麦叶部病害图像像素等级较高(256256),为提取在图像更深处的隐藏特征,增加网络的非线性映射能力,本文构建2层全连接层,并增加每一全连接层上卷积核的数量,该层的每一个神经元与前一层的所有神经元进行连接,同层神经元之间不连接。全连接层结构如表17所示。表17全连接层结构Table17Thestructureoffullyconnectedlayer名称F6F7TypeInner-productInner-productKernal_Size1111Kernal_Sum10242048Stride_Col11Stride_Row11Padding_Col00Padding_Row00Lr_weight15Lr_bias210Momentumcoefficient0.90.9Output_Sum1024204852 山东农业大学硕士论文其中,F后边连接LSVM作为分类器,用来输出分类结果和精度损失等其它信7息。II.LSVM由于标准SVM在每次迭代训练时都要使用全部样本,算法时间复杂度高,大多数情况下不符合“一致性蕴含局部性”的思想,只有在特定情景下才同时满足均匀近似可局部性(UniformApproximateLocalizability,UAL)和均匀近似局部一致性(UniformApproximateLocalConsistency,UALC)。针对上述问题,人们设计LSVM来改善原始算法,为了在不牺牲分类精度的前提下,减少参与计算的样本数量,提高算法效率。LSVM在SVM基础上融合KNN的优势,引入(,)xx来衡量测试样本x与训练样本xii的相似度,LSVM的优化目标为:n661TminwwC(,)xxiiCij(,)iwb,,2i1|yi1i1|yi1i1|yi1st..y(w()xb)1(5.1)iii0,in1,2,...,i[0,1]其中,w为最优分类超平面的法向量,C是惩罚参数,用来衡量对样本误分的惩罚力度。是松弛变量,表示每个样本不满足约束条件y(w()xb)1的程度,iii()x是x在特征空间中的向量。ii为解决LSVM对于不平衡数据集分类精度低的问题,本文在损失函数中引入多个惩罚因子Cij(,),以提高LSVM对不平衡数据集误分情况的敏感度:n881TminwwC(,)xxiiCmn(,)iwb,,2i1m1n1st..y((iw()xib))1i,i0,mn(5.2)m1,2,...,nn1,2,...,,n为求解上述二次规划问题,引入Lagrange乘子和,构建Lagrange函数:iin881TLwb(,,,)wwC(,)xxiiCmn(,)i2i1m1n1(5.3)NNi(((yiw())xib)1i)iiii11利用上式可求得与公式(5.1)等价的对偶问题,即下列凸二次规划问题:53 基于卷积神经网络的小麦叶部病害图像识别88N1minmnyymnKxx(,)ii2m1n1i1Ns.t.yii0i1(5.4)0Cmnm(,),nim=1,2,...,8n=1,2,...,8****求出上述优化问题的最优解向量(,,...,),则LSVM的决策函数fx()可11l表示为:l*fx()sgn(iiK*(,)xxb)(5.5)i1关键是对惩罚因子进行赋值,惩罚因子通过表18的代价敏感矩阵来定义:表18代价敏感矩阵Table18Costsensitivematrix1234567810C(1,2)C(1,3)C(1,4)C(1,5)C(1,6)C(1,7)C(1,8)2C(2,1)0C(2,3)C(2,4)C(2,5)C(2,6)C(2,7)C(2,8)3C(3,1)C(3,2)0C(3,4)C(3,5)C(3,6)C(3,7)C(3,8)4C(4,1)C(4,2)C(4,3)0C(4,5)C(4,6)C(4,7)C(4,8)5C(5,1)C(5,2)C(5,3)C(5,4)0C(5,6)C(5,7)C(5,8)6C(6,1)C(6,2)C(6,3)C(6,4)C(6,5)0C(6,7)C(6,8)7C(7,1)C(7,2)C(7,3)C(7,4)C(7,5)C(7,6)0C(7,8)8C(8,1)C(8,2)C(8,3)C(8,4)C(8,5)C(8,6)C(8,7)0Note:1:正常叶片;2:机械损伤;3:白粉病;4:细菌性条斑病;5:小斑病;6:条锈病;7:叶锈病;8:细菌性叶枯病;表18中,横向代表真实分类,纵向代表预测分类,C(i,j)表示将真实类别为j的样本预测为i时的惩罚因子。NathalieJapkowicz等提出了一种使用两类样本数量相互设为惩罚参数的方法,即选取参数CMajnum_,CMinnum_,Minnum_为少数类样本的数目,Majnum_为多数类样本的数目。但这种用两类样本数量来定义惩罚参数的方式具有一定的局限性,因为数据的不平衡性不仅表现在样本数量上的差异,也与样本在空间中分布的复杂性有关。上述赋值方法只考虑了前一种状况,没有考虑后一种,因此,本文在此基础上提出了一种新的惩罚因子赋值方法,同时兼顾小麦叶部病害图像在数量和空间分布上的不平衡性。惩罚参数赋值机制如Algorithm5.1所示。54 山东农业大学硕士论文Algorithm5.1惩罚参数赋值机制Require:少数类样本Min|1iMinnum_,多数类样本Maj|1iMajnum_。ii1:分别对少数类样本Min和多数类样本Maj进行聚类运算,找出各类样本的中心点xiiMin和x:MajMinnu_mMinii1x(5.6)MinMin_numMajnu_mMajii1x(5.7)MajMaj_num其中,Minnum_和Majnum_分别是两类样本的数量。Minnum_Majnum_222:求得两类中所有样本到该中心的欧氏距离之和xxMinMin和xxMajMaj,i1i1再除以每类样本的数量Minnum_和Majnum_,求得两类样本的中心距离均值MinAvg_和MajAvg_:Majnum_2xxMajMaji1Maj_avg(5.8)Maju_nmMinnum_2xxMinMini1Min_avg(5.9)Minu_nm其结果近似于高维空间中包含两类样本的超球体的半径;3:用样本数量与中心距离均值的比值为惩罚因子赋值:Minnum_C(5.10)Minavg_Majnum_C(5.11)Majavg_图29展示了Algorithm5.1中两类样本的超球体、样本中心和中心距离均值的概念。55 基于卷积神经网络的小麦叶部病害图像识别Hyper-SphereofMajorityMaj_avgxMajxMinMin_avgHyper-SphereofMinority图29超球体、样本中心和中心距离均值Fig.29Thehyperspheres,samplecentersandmeandistancebetweencentersoftwotypesofsamples5.3数据获取与预处理5.3.1数据获取在山东省境内的小麦种植基地和实验田,对济麦20号、烟农19号等小麦品种的发病叶部图像进行人工实地采集,采集工具为数码相机CanonEOS700D18-135,图像格式为JPEG,分辨率为53122988,24位图,图像数量为6028张,包含6类常见叶部病害以及正常叶片和机械损伤叶片,该图像集不平衡性显著,与第三章中的图像集相互独立,图像样例如表19所示。表19小麦叶部病害图像样本Table19Samplesofwheatdiseaseimages名称样本正常叶片机械损伤白粉病细菌性条斑病56 山东农业大学硕士论文小斑病条锈病叶锈病细菌性叶枯病5.3.2数据预处理CNN自学习依赖于在大规模数据集上进行的迭代训练,数据量过小时,容易发生过拟合,使得训练误差很小,测试误差特别大,为增加小麦叶部病害图像的规模和多样性,本文通过表20中的图像增强方法对采集到的小麦叶部病害图像进行处理。表20图像增强方法Table20Imageaugmentation名称具体操作在256256大小的原始图像上随机选定CropCenter,再采用224224大小的窗口对其进行截图,随机截取为了统一图像输入尺寸,再将截图拉伸至256256。噪声添加对原始图像添加了30%的高斯噪声,偏移量为0.2,标准差为0.3。Color将原始图像的色相,饱和度和明度各增加20%,对比度增加30%,锐度降低10%。jittering首先计算R,G,B三个颜色通道的均值和标准差,对网络输入信号进行归一化,然后在RGB空间对训练样本的像素值进行PCA降维,得到R、G、B3个主方向上的向量p,p,p和3个特征值,1231PCAjitteringTT2,3,再在图像的每个像素Ixy[IRxy,IGxy,IBxy]上加上[,ppp12,3][11,22,33],i是满足均值为0、差为0.1的随机变量.分别采用旋转模糊和缩放模胡对原始图像进行径向模糊,旋转模糊单元为10,缩放模糊单元为30,径向模糊用于模拟旋转或前后移动相机的拍摄效果,达到类似放射一样的功能,实现自然补光。图像增强一方面增加训练集的数量和多样性,减少过拟合;另一方面扩张数据集的范围,使网络挖掘到的特征具有更多对于旋转、缩放等操作的不变性;其次,使得图像的不平衡性更加明显,所占比例较大和较小的病害种类之间的数量差距进一步扩57 基于卷积神经网络的小麦叶部病害图像识别大,能够更好的测试CNN-LSVM在处理非平衡图像集的实际性能。图像增强的处理效果如表21所示。表21增强图像Table21Imagesprocessedbyimageaugmentation名称样本原始图像随机裁剪噪声添加ColorJitteringPCAJittering旋转模糊缩放模胡图像增强处理完后产生的不平衡数据集相当于8种小麦叶部图像分别产生6种增强后的图像,共有36168张,每种图像的数量和比例如表22所示。表22不平衡数据集中每种图像的数量和比例Table22NumberandproportionofeachmaizediseaseimageinISIS名称正常叶片机械损伤白粉病细菌性条斑病小斑病条锈病叶锈病细菌性叶枯病数量66966222289221726876198663662958比例/%0.1850.1720.0800.0600.1900.0550.1760.08258 山东农业大学硕士论文后期为测试CNN-LSVM,将其与其他算法对不平衡和平衡的小麦叶部病害图像集进行分类,本文通过Borderline-SMOTE算法对上述的不平衡数据集进行平衡处理,以产生平衡数据集。Borderline-SMOTE算法如Algorithm5.2所示。Algorithm5.2Borderline-SMOTERequire:多数类样本Maj|1iMajnum_,少数类样本Min|1iMinnum_最近邻数量ii,k,训练样本xi。1:foreachMin:i1.1.计算点p在训练样本x上的k个最近邻(本文中取k5,从而使调整后的iMinnumMajnum_/_0.5),设该集合为Kp,定义变量m`KpMaji|1iMajnum_,表示集合Kp中属于多数类的数量。1.2.Ifmk`,说明p周围都是多数类,p是一个噪声,不做任何操作。1.3.If0mk`2,说明p周围有多于k2的少数类样本和少于k2的多数类样本,不做任何操作。1.4.Ifk2`mk,说明p周围有多于k2的多数类样本和少于k2的少数类样本,要在p附近生成一些新的少数类点,将其把List队列中。2:foreachsampleinList:2.1.计算点p`在Mini|1iMinnum_中的k个最近邻,p`Mini|1iMinnum_。2.2.有放回地随机抽取RR(k)个最近邻。2.3.通过公式pp(`pp)随机产生R个新样本,pp`代表最近邻p`与点p的欧氏距new离之差,是一个随机数且满足[0,1]。2.4.将新样本p加入Min|1iMinnum_中。newi通过Borderline-SMOTE产生的平衡数据集的图像总数为46176,每种叶片图像的数量和比例如表23所示。表23平衡数据集中每种图像的数量和比例Table23NumberandproportionofeachmaizediseaseimageinBSBS细菌性条细菌性叶名称正常叶片机械损伤白粉病小斑病条锈病叶锈病斑病枯病数量66966222578443446876397263665916比例/%0.1450.1350.1250.0940.1490.0860.1380.1285.4实验设计与结果分析(1)CNN-Softmax、CNN-SVM和CNN-LSVM为验证CNN-LSVM的性能,将其与CNN-Softmax和CNN-SVM进行对比实验,三者分别在不平衡数据集和平衡数据集上进行30000次迭代,然后用训练得到的模型对测试集进行分类,实验结果如图30和图31所示:59 基于卷积神经网络的小麦叶部病害图像识别图30CNN-LSVM,CNN-Softmax和CNN-SVM对不平衡数据集的分类精度.Fig.30TheidentificationaccuracyofCNN-LSVM,CNN-SoftmaxandCNN-SVMinISIS图31CNN-LSVM,CNN-Softmax和CNN-SVM对平衡数据集的分类精度Fig.31TheidentificationaccuracyofCNN-LSVM,CNN-SoftmaxandCNN-SVMinBSBS从图30可以看出,在处理不平衡数据集时,常见的CNN-Softmax和CNN-SVM模型的平均分类精度在74.87%左右,明显低于CNN-LSVM的90.32%的平均分类精度。从实验过程来看,CNN-LSVM在迭代次数达到13000次左右模型开始收敛,而CNN-SoftmaxandCNN-SVM需要在15000之后才陆续达到稳定的分类精度。实验结果和过程说明,CNN-LSVM对于不平衡数据集具有较高的分类精度和学习速率。60 山东农业大学硕士论文从图31可知,在处理平衡的数据集时,CNN-LSVMHL的分类精度比CNN-Softmax和CNN-SVM高,但不明显;在模型收敛速度上,CNN-LSVMHL还是具有比CNN-Softmax和CNN-SVM较快的学习速率。(2)CNN-LSVM、LSVM和SVM为验证CNN在自动提取图像特征的优势和LSVM缓解不平衡数据问题的效果,将CNN-LSVM与LSVM和SVM做对比,3者分别在不平衡数据集和平衡数据集上进行30000次迭代训练分类模型。LSVM与SVM的处理对象是从颜色、纹理和形状3个方面对小麦病害图像提取的49维特征向量,此外,SVM采用径向基核函数,惩罚参数C为10,gamma(g)为0.00010183,ζ为0.001,q为3。具体的图像特征提取如表24所示。表24小麦叶部病害图像特征提取Table24Featureextractionofwheatleafdiseaseimages种类参数数量总数HSV颜色空间一阶矩灰度值(H,S,V)。3颜色特征6HSV颜色空间二阶矩灰度值(H’,S’,V’)。3RGB、HSV颜色空间θ=0°灰度共生矩阵中能量E、熵H、惯性矩I、相关性C。8RGB、HSV颜色空间θ=45°灰度共生矩阵中能量E、熵H、惯性矩I、相关性8C。纹理特征RGB、HSV颜色空间θ=90°灰度共生矩阵中能量E、熵H、惯性矩I、相关性328C。RGB、HSV颜色空间θ=135°灰度共生矩阵中能量E、熵H、惯性矩I、相关性8C。Hu不变矩:m(1),m(2),m(3),m(4),m(5),m(6),m(7)。7面积(S)。1形状特征周长(L)。111圆度(C)。1复杂度(E)。1CNN-LSVM、LSVM和SVM对于不平衡数据集和平衡数据集的分类精度如图32所示。61 基于卷积神经网络的小麦叶部病害图像识别图32CNN-LSVM,LSVM和SVM对不平衡数据集和平衡数据集的分类精度Fig.32TheidentificationaccuracyofCNN-LSVM,LSVMandSVMinISISandBSBS从图32可以看出,在对两种数据集的分类实验中,CNN-LSVM的分类精度均明显高于LSVM和SVM,这是由于CNN能够自动提取和组合图像深层次的抽象特征,不仅数量充足,而且更能揭示像素的真实分布,通过LSVM对CNN学习到的特征向量进行分类能够得到较好的分类效果。人工提取的特征数量有限,且位于图像浅层,表征能力不强,从而产生较低的分类精度。LSVM在处理不平衡数据集时的分类精度也明显高于SVM,因为LSVM中针对不平衡数据问题加入的惩罚因子以及赋值机制,使得算法本身对样本的数量比例和空间分布更加敏感,在出现因不平衡造成的误分时,能够及时修正模型走势。而在处理平衡数据集时,LSVM的分类精度相比较SVM有提升,但不显著,因为该数据集不存在不平衡问题,两种算法在这方面是平等的,但LSVM能够较好地利用样本局部信息,获得更高的分类精度。5.5本章小结为了解决传统CNN对不平衡小麦叶部病害图像分类精度低的问题,本文引入LSVM作为分类器,先通过K近邻降低算法时间复杂度,再添加与数据集的不平衡性相适应的惩罚因子,使模型对因不平衡性造成的误分情况更加敏感,并综合考虑图像集在数量和空间分布上的不平衡性对因子进行赋值。对小麦叶部病害图像识别的实验结果表明,在对不平衡和平衡数据集进行分类时,CNN-LSVM均具有较高的分类精度和较快的模型收敛速度。62 山东农业大学硕士论文6总结与展望6.1本文总结本文以CNN为理论基础,以提高小麦叶部病害图像的识别精度为目的,实现了3种基于改进CNN的小麦叶部病害识别方法,本文的主要研究工作和创新之处:(1)提出了一种基于细粒度差分放大卷积神经网络的小麦叶部病害识别方法。该模型的改进在于卷积核矩阵和差分放大支路,这种设计提高了网络整体对于数据集的拟合能力,从而获得更高的识别精度。(2)提出了一种基于多道式卷积神经网络的小麦叶部病害识别方法。该模型打破了传统CNN中隐藏层的线性组合,通过添加支路,允许网络中第1个和第2个下采样层直接与第1个全连接层相连,实现了对不同层次图像特征的综合利用。(3)提出了一种针对不平衡小麦叶部病害图像识别的CNN-LSVM模型。由于CNN在不平衡图像的分类中存在精度低、速度慢等问题,该模型将LSVM与CNN相结合,提出了一种CNN-LSVM模型,设计代价敏感矩阵并为惩罚参数赋值,使模型对于因数据集不平衡性导致的误分状况更加敏感,修正模型收敛走势,使其适用于不平衡数据集的分类。6.2工作展望本文下一步的工作是。(1)网络结构的创新。目前,大多数对于卷积神经网络的研究往往是在前人的工作基础上进行的,缺乏革新,例如,为提高网络性能而进行隐藏层简单的线性叠加,产生更多像过拟合,网络退化,参数爆炸等额外问题。对CNN的结构进行改善和创新是未来研究重点。(2)参数优化。深度神经网络往往普遍存在参数饱和甚至是参数爆炸现象,CNN也不例外,如果只是盲目的减少参数或者让参数共享权值,网络的性能又会下降,因此,对于CNN参数的量化分析与优化是未来另一个研究工作。(3)半监督和无监督学习。数量庞大、质量较高、类别丰富的标签数据集对于CNN的性能提升具有十分重要的意义,但现实生活中这种数据集非常稀有,因此,实现CNN的半监督甚至是无监督训练是未来工作之一。63 基于卷积神经网络的小麦叶部病害图像识别(4)与其它学科的融合创新。CNN的强大在于它对外界的感知能力,在某些特定条件下,与其他学科的融合创新会产生更大的作用和价值,例如分别与强化学习和迁移学习融合产生的深度强化学习和深度迁移学习,这些融合都有助于拓展CNN向更为广阔的应用领域发展,也是未来重要的研究方向。64 山东农业大学硕士论文参考文献柴阿丽,李宝聚,石延霞,岑喆鑫,黄海洋,刘君.基于计算机视觉技术的番茄叶部病害识别[J].园艺学报,2010,37(9):1423-1430.陈丽,王兰英.概率神经网络在玉米叶部病害识别中的应用[J].农机化研究,2011,33(6):145-148.蔡清,何东健.基于图像分析的蔬菜食叶害虫识别技术[J].计算机应用,2010,30(7):1870-1872.柴洋,王向东.基于图像处理的温室大棚中番茄的病害识别[J].自动化技术与应用,2013,32(9):83-89.岑喆鑫,李宝聚,石延霞,黄海洋,刘君,廖宁放,冯洁.基于彩色图像颜色统计特征的黄瓜炭疽病和褐斑病的识别研究[J].园艺学报,2007,34(6):1425-1430.管泽鑫,唐健,杨保军,周营烽,范德耀,姚青.基于图像的水稻病害识别方法研究[J].中国水稻科学,2010,24(5):497-502.刘立波.基于图像的水稻叶部病害诊断技术研究[D].中国农业科学院,2010.李旺.基于图像处理的黄瓜叶部病害识别研究[D].湖南农业大学,2013.毛罕平,张艳诚,胡波.基于模糊C均值聚类的作物病害叶片图像分割方法研究[J].农业工程学报,2008,24(9):136-140.濮永仙.基于支持向量机与多特征选择的农作物彩色病斑边缘检测[J].计算机系统应用,2014,23(9):118-123.彭占武.基于图像处理和模式识别技术的黄瓜病害识别研究[D].吉林农业大学,2007.祁广云,马晓丹,关海鸥.采用改进遗传算法提取大豆叶片病斑图像[J].农业工程学报,2009,25(5):142-145.任玉刚,张建,李淼,袁媛.基于分水岭算法的作物病害叶片图像分割方法[J].计算机应用,2012,32(3):752-755.石凤梅,赵开才,孟庆林,马立功.基于支持向量机的水稻稻瘟病图像分割研究[J].东北农业大学学报,2013(2):128-135.宋凯,孙晓艳,纪建伟.基于支持向量机的玉米叶部病害识别[J].农业工程学报,2007.1,23(1):155-157.邵庆,张楠,路阳.小麦病害图像识别处理及形状特征提取研究[J].农机化研究,2013(8):35-37.65 基于卷积神经网络的小麦叶部病害图像识别孙志军,薛嘉,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810.田有文,李天来,李成华,朴在林,孙国凯,王滨.基于支持向量机的葡萄病害图像识别方法[J].农业工程学报,2007,23(6):175-180.温长吉,王生生※,于合龙,苏恒强.基于改进蜂群算法优化神经网络的玉米病害图像分割[J].农业工程学报,2013,29(13):142-149.许良凤,徐小兵,胡敏,王儒敬,谢成军,陈红波.基于多分类器融合的玉米叶部病害识别[J].农业工程学报,2015.7,31(14):194-201.王克如.基于图像识别的作物病虫草害诊断研究[D].中国农业科学院,2005.王娜,王克如,谢瑞芝,赖军臣,明博,李少昆.基于Fisher判别分析的玉米叶部病害图像识别[J].中国农业科学,2009.11,42(11):3836-3842.王守志,何东键,李文,王艳春.基于核K_均值聚类算法的植物叶部病害识别[J].农业机械学报,2009.3,40(3):152-155.张柏毅,朱景福,刘勇.基于模糊C-均值聚类的作物叶部病斑图像分割[J].智能计算机与应用,2011,01(5):50-51.王美丽,牛晓静,张宏鸣,赵建邦,何东健.小麦叶部常见病害特征提取及识别技术研究[J].计算机工程与应用,2014,50(7):154-157.赵玉霞,王克如,白中英,李少昆,谢瑞芝,高世菊.基于图像识别的玉米叶部病害诊断研究[J].中国农业科学,2007,40(4):698-703.赵进辉,罗锡文,周志艳.基于颜色与形状特征的甘蔗病害图像分割方法[J].农业机械学报,2008,39(9):100-103.张飞云.基于量子神经网络和组合特征参数的玉米叶部病害识别[J].南方农业学报,2013,44(8):1286-1290.张善文,张传雷.基于局部判别映射算法的玉米病害识别方法[J].农业工程学报,2014.6,30(11):167-172.BeckerS,LecunY.ImprovingtheConvergenceofBack-PropagationLearningwithSecond-OrderMethods[C]//Proc.ofthe1988ConnectionistModelsSummerSchool.1989,209-222.CollobertR,WestonJ,KarlenM,JinX.NaturalLanguageProcessing(Almost)fromScratch[J].JournalofMachineLearningResearch,2011,12(1):2493-2537.66 山东农业大学硕士论文COLLOBERTR.Deeplearningforefficientdiscriminativeparsing[C]//Procofthe14thInternationalConferenceonArtificialIntelligenceandStatistics.2011,224-232.ConklinJD.AppliedLogisticRegression[J].Technometrics,2000,44(1):81-82.DengJ,DongW,SocherR,LiLJ,LiK,LiFF.ImageNet:alarge-scalehierarchicalimagedatabase.In:Proceedingsofthe2009IEEEConferenceonComputerVisionandPatternRecognition.Miami,FL:IEEE,2009,248−255.ENRishi,EJSGill.RecognitionoftheImagebyUsingPlantDiseasesOntologyinImageProcessing.InternationalJournalofModernComputerScience(IJMCS).2015.10,3(3).FukushimaK.Neocognitron:Aself-organizingneuralnetworkmodelforamechanismofpatternrecognitionunaffectedbyshiftinposition[J].BiologicalCybernetics,1980,36(4):193-202.FriedmanJ,HastieT,TibshiraniR.SpecialInvitedPaper.AdditiveLogisticRegression:AStatisticalViewofBoosting[J].AnnalsofStatistics,2000,28(2):337-374.HintonGE,SalakhutdinovRR.Reducingthedimensionalityofdatawithneuralnetworks[J].Science,2006,313(5786):504-507.HeK,ZhangX,RenS,SunJ.DeepResidualLearningforImageRecognition[C]//ComputerVisionandPatternRecognition.IEEE,2016:770-778.HubelDH,WieselTN.Receptivefields,binocularinteractionandfunctionalarchitectureinthecat`svisualcortex.JournalofPhysiology,1962,160(1):106-154.HearstMA,DumaisST,OsmanE,PlattJ,ScholkopfB.Supportvectormachines[J].IEEEIntelligentSystems&TheirApplications,2002,13(4):18-28.JrDGS,PintoFAC,QueirozDM,VianaPA.FallArmywormDamagedMaizePlantIdentificationusingDigitalImages[J].BiosystemsEngineering,2003,85(4):449-454.KrizhevskyA,SutskeverI,HintonGE.ImageNetclassificationwithdeepconvolutionalneuralnetworks.In:ProceedingsofAdvancesinNeuralInformationProcessingSystems25.LakeTahoe,Nevada,USA:CurranAssociates,Inc.2012,1097−1105.LeeH.,GrosseR.,RanganathR.,NgA.Y.Convolutionaldeepbeliefnetworksforscalableunsupervisedlearningofhierarchicalrepresentations.Proc.26thInt.Conf.MachineLearning,ICML2009,pp.609-616.Canada,Montreal,Quebec:DBLP.2009.LiuLZ,ZhangW,ShuSB,JinX.ImageRecognitionofWheatDiseaseBasedonRBFSupportVectorMachine[J].2013,41(4):307-310.LeCunY,BottouL,BengioY,HaffnerP.Gradient-basedlearningappliedtodocumentrecognition[J].ProceedingsoftheIEEE,1998,86(11):2278-2324.67 基于卷积神经网络的小麦叶部病害图像识别LeCunY,BoserB,DenkerJS,HendersonD,HowardRE,HubbardW,JackelLD.BackLD.propagationappliedtohandwrittenzipcoderecognition[J].NeuralComputation,1989,1(4):541-551.OuyangW,LuoP,ZengX,QiuS,TianYL,LiHS,YangS,WangZ,XiongY,QianC,ZhuZY,WangRH,Chen-ChangeLoy,Wang,XiaoouTang.DeepID-Net:multi-stageanddeformabledeepconvolutionalneuralnetworksforobjectdetection[J].EprintArxiv,2014.PujariJ,YakkundimathR,ByadgiA.ClassificationofFungalDiseaseSymptomsaffectedonCerealsusingColorTextureFeatures[J].InternationalJournalofSignalProcessingImageProcessing&PatternRecognition,2013,6.PujariJ,YakkundimathR,ByadgiA.ClassificationofFungalDiseaseSymptomsaffectedonCerealsusingColorTextureFeatures[J].InternationalJournalofSignalProcessingImageProcessing&PatternRecognition,2013,6.PanigrahiS.BackgroundSegmentationandDimensionalMeasurementofComGermplasm.TransactionsoftheASAE.1995,38(1):291-297.RusakovD,DanG.AsymptoticModelSelectionforNaiveBayesianNetworks[J].JournalofMachineLearningResearch,2005,6(1):438--445.RupaliS.Zambre,SonalP.Patil,GaneshN.Dhanokar.ClassificationandGradingofWheatGranulesusingSVMandNaiveBayesClassifier.InternationalJournalonRecentandInnovationTrendsinComputingandCommunication.ISSN:2321-8169.2015.8,3(8),pp.5322-5327.SarkarN,LittleAD,WolfeRR.Computervisionbasedsystemforqualityseparationoffreshmarkettomatoes[J].Paper-AmericanSocietyofAgriculturalEngineers(USA),1984,28(5):1714-1718.Sammany,M.,MohammedEl-Beltagy.OptimizingNeuralNetworksArchitectureandParametersUsingGeneticAlgorithmsfordiagnosingPlantDiseases[A].Proceedingof2ndInternationalComputerEngineeringConference[C],IEEE(Egyptsection),2006.Sammany,M.,T.Medhat:DimensionalityReductionUsingRoughSetApproachforTwoNeuralNetworks-BasedApplications[A].RoughSetsandIntelligentSystemsParadigms[C].Heidelberg:SpringerBerlin,2007,639-647.SzegedyC,LiuW,JiaY,SermanetP,ReedS,AnguelovD,ErhanD,VanhouckeV,RabinovichA.Goingdeeperwithconvolutions[C]//ComputerVisionandPatternRecognition.IEEE,2015:1-9.68 山东农业大学硕士论文SilverD.,HuangA.,MaddisonC.J.,GuezA.,SifreL.,DriesscheG.,,AntonoglouI,PanneershelvamV,LanctotM1,DielemanS1,GreweD,NhamJ,KalchbrennerN,SutskeverI,LillicrapT,LeachM,KavukcuogluK,GraepelT,HassabisD.MasteringthegameofGowithdeepneuralnetworksandtreesearch.Nature,2016,529(7587),484-489.SimonyanK.,ZissermanA.VeryDeepConvolutionalNetworksforLarge-ScaleImageRecognition.Ineprintar{X}iv:arXiv:1409.2014,1556(5).6,1-14.Sammany,M.,Zagloul,K.:SupportVectorMachineVersusanOptimizedNeuralNetworksforDiagnosingPlantDiseases[A].Proceedingof2ndInternationalComputerEngineeringConference[C],IEEE(Egyptsection),2006,RH25-31.SasakiY,SuzukiM.ConstructionoftheAutomaticDiagnosisSystemofPlantDiseaseUsingGeneticProgrammingWhichPaidItsAttentiontoVariety[C]//2003,LasVegas,NVJuly27-30,2003.TianY,ZhaoC,LuS,GuoX.SVM-basedMultipleClassifierSystemforrecognitionofwheatleafdiseases[C]//WorldAutomationCongress.IEEE,2012:189-193.TaigmanY,YangM,RanzatoM,WolfL.DeepFace:ClosingtheGaptoHuman-LevelPerformanceinFaceVerification[C]//IEEEConferenceonComputerVisionandPatternRecognition.IEEEComputerSociety,2014:1701-1708.TiviveFHC,BouzerdoumA.AGenderRecognitionSystemusingShuntingInhibitoryConvolutionalNeuralNetworks[C]//InternationalJointConferenceonNeuralNetworks.IEEEXplore,2006:5336-5341.YuatakaSASAKI,TsuguoOKAMOTO,KenjiIMOU,TOR.AutomaticDiagnosisofPlantDisease.JournalofJSAM.1999,61(2):119~126.ZeilerMD,FergusR.VisualizingandUnderstandingConvolutionalNetworks[J].2013,8689:818-833.ZhaoZ.H.,YangS.P.,&MaZ.Q.ResearchonvehiclelicenseplatecharacterrecognitionbasedonCNNLeNet-5.J.ofSyst.Simulation,2010,22(3),424638-641.69 基于卷积神经网络的小麦叶部病害图像识别致谢光阴似箭,日月如梭,转眼间我的三年硕士求学时光就要结束了,这将是我人生中一段值得回忆的宝贵经历,也是迅速提高自身价值的宝贵时光,这期间取得的收获离不开所有关心我和帮助我的人,在此,我对他们表示真诚的感激之情。首先,要感谢我的导师牟少敏教授。牟老师治学严谨,学识广博,在选题、论文撰写和实验设计等阶段都给了我宝贵且详细的指导,其缜密的逻辑思维和正直的品格深深地影响着我。在学习和生活中,牟老师时常谈起自身的求学经历,他那种卧薪尝胆艰苦奋斗的精神也时常给我强大的动力,对我今后的人生道路产生了深远的影响。其次,我还要感谢学院各位任课老师和领导,他们努力为我们营造了一个积极向上的学习氛围。对于学生的任何问题,他们都是耐心解答、积极帮助,从他们身上我学习到了敬业精神和奉献精神。还要感谢我所有的同学和朋友,尤其是师兄师弟师姐师妹,他们在学习工作和日常生活中给了我很大的帮助。最后,要感谢在背后默默支持我的家人,他们是我强而有力的后盾。父母以及爷爷奶奶的殷切关怀与问候都成为我内也奋斗坚持的动力,你们的付出我牢记也中,谢谢你们!谢谢各位审阅本文的评委,你们的指导建议将使我更加进步,再次感谢!70 山东农业大学硕士论文攻读学位期间发表论文情况林中琦,牟少敏,时爱菊,孙肖肖,李磊.基于Spark的支持向量机在小麦病害图像识别中的应用[J].河南农业科学,2017,46(07):148-153.XiumeiWang,ShaominMu,AijuShiandZhongqiLin.AStackedDenoisingAutoencoderBasedonSupervisedPre-training[C].AdvancesinIntelligentSystemsandComputing.Berlin:Springer,2017.曹宏斌,张亮,林中琦.基于用户分裂的资源扩散算法[J].中国电子科学研究院学报,2017,12(02):159-163.李磊,牟少敏,林中琦.随机森林在棉蚜虫害等级预测中的应用[J].安徽农学通报,2017,23(01):18-20.71

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭