基于深度学习的图像语义理解和分类研究

基于深度学习的图像语义理解和分类研究

ID:35067177

大小:5.71 MB

页数:56页

时间:2019-03-17

上传者:U-24835
基于深度学习的图像语义理解和分类研究_第1页
基于深度学习的图像语义理解和分类研究_第2页
基于深度学习的图像语义理解和分类研究_第3页
基于深度学习的图像语义理解和分类研究_第4页
基于深度学习的图像语义理解和分类研究_第5页
资源描述:

《基于深度学习的图像语义理解和分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

‘-?-.-..T'...,V.fV.,一-■J-V..*'.'.诗.’乃‘/V/,■■\I..、分类号TP391.4/,学号201313703004学校代码10488密级;':I一-、''一.乃一八心皆證硕±学位论文‘.'、/V.游'一/..(.<,八基于巧度学习的图像语义理巧和分类\茜研究'片.?.'...、:苦\’V’-'i;4VV:学位申请人:m学科专业:计算机科学与技术■?指导教师:m答辩日期:2016.05.21.-i'?....j\'''^-V>-V'?-'.'4.'巧,..:, ADissertationSubmittedUlPartialFulfillmentof化6RequirementsfbrtheDegreeofMas化ri田EngineeringImageclassificationandsemanticresearchbasedondeelearningpMastierCandidate:PinWugMaor:ComuterscienceandtechnolojpgySupervisor:Prof.ZhangWuhanUniversitofScienceandTechnoloygyWuhan,Hubei430081,P.R.ChinaMa2016y, 武汉科技大学研究生学位论文创新性声明本人郑重声明:所呈交的学位论文是本人在导师指导下,独立进行研究所取得的成果。除了文中己经注明引用的内容或属合作研究共同完成的工作外,本论文不包含任何其他个人或集体己经发表或撰写过的作品成果。。对本文的研究做出重要贡献的个人和集体,均已在文中明确方式标明一申请学位论文与资料若有不实之处,本人承担切相关责任。论文作者签名:征曰期:岐;、、,4研究生学位论文版权使用授权声明本论文的研究成果归武汉科技大学所有,其研究内容不得レッ其它单位的名义发表。本人完全了解武汉科技大学有关保留、使用学位论文的规定,同意学校保留并向有关部n(按照《武化科技大学关于研究生学位论文收录工作的规定》执行)送交论文的复印件和电子版本,允许论文被查阅和借阅,同意学校将本论文的全部或部分内容编入学校认可的国家相关数据库进行检索和对外服务。论文作者签名:4豕指导教师签名:^參日期:如ds、y 摘要随着当今社会互朕网技术的快速发展,w及图像多媒体等设备的流行,越来越多的人开始在网络上发表、下载和共享图像资源,W图像数据为代表的多媒体视觉信息量日益剧增。因此,如何对目前存在的海量图像信息进行有效而准确的分类管理和信息标注是亟待解决的技术难题与研究热点。传统的图像分类方法中,大多数根据人为定义的规则来对原始图像数据进行处理计算得到相应的特征矩阵;而深度学习算法则通过对计算机的训练过程来自一动学习持征。因此,本文提出了种改进的Softmax回归模型与基于线性解码器深度神经网络相结合的图像分类算法。首先,通过基于线性解码器的神经网络训练得到局部小图像的特征,再通过卷积、池化得到原始大图像的特征矩阵;其次,通过传统特征提取算法得到图像的颜色和纹理特征;然后结合这两类图像特征对参数优化后的Softmax回归模型进巧训练并结合距离度量完成图像分类,得到最终分类结果。在实验结果的对比分析中,采用查准率、查全率作为评价指标,验证了基于。深度学习的图像语义理解和分类方法的有效性和优越性同时,将实验与多种传统分类方法做了对比,实验结果显示出该算法具有较高的分类能力。关键词:图像分类;深度学习;线性解码器;Softmax回归模型I Abstrad:WiththeviorousdevelomentofInternetandmultimediatechnoloaswellasgpgy,therisingpopularhyofsocialmedia,moreandmorepeoplebegin化upload,downloadandshareimagesKsourcesintheInternet.Imagedataraduallbecomeanimortantgypmediumofinformationexchangeandifsgrowingatallastonishingrate.Therefore,how化classifyandmanaementthemassiveimaedataisnotonlanurentroblem,butggygpalsoachallengingand化ward虹gproject.Thetrad扣onalimageclassi扫cationmethodsalsoobtain把aturesbypreprocessing化6originalimagedatawi也somediferentrulesdefinedbypeople.Butthedeeplearningalgorithmautomalicallylearningfeatur的through化etrainingproc货sof化ecomputers.Therefore,thispaperproposesanimageclassi巧cationalgori出mbasedondeepneuralnetworkoflineardecodo:andsoftmaxregressionmodel.First,weleam佐aturesofsomesmallimagepatcheswi化lineardecoder,andbyconvolvingandpoolingthelargeimageswiththelearned色atures,化enweobtainthepooledconvolvedfeatures;scGoiidly,extracttheimagecolorandbxture拓atures;thirdly,weusesoftmaxregressionmodeltotrainthe拓atures;finall乂withcolor,texturefeaturesanddistancemetric,wecanobtainthefinalclassificationresults.虹theeva山ationof化eexerimentalresultsweuserecisionandKcallasp,pstandards.Experimentalresultsshowthatthismethodcannotonlyachievegooderformancebutalso化eclassi扫cationaccuracishier化antraditio凸alimaep,yghgclassi巧cationalgorithm.Kewords:ImaeclassificationDeelearninLineardecoderSoftmaxKressiooyg;pg;;gmodeln 目录I摘要ABSTRACTII第1章绪论1111.研巧背景1.2国内外研究现状21.3本文的主要工作41.4本文的结构安排4第2章图像分类研究综述6216.图像分类流程2.2传统神经网络727.2.1基本思想2.2.2BP神经网络8.1223深度学习简介2.3.1基本思想12132.3.2训练过程概述24图像分类中的相关性度量14.1255.本章小结第3章图像视觉特征分析与深度学习163116.图像传统特征提取3丄116颜色特征3丄2纹理特征183.2基于深度学习的图像特征分析213.2.1基于线性解码神经网络的特征分析213.2.2基于部分联通网络的卷积特征弘3.3本章小结28第4章基于回归预测的图像分类算法巧III 4.1基于SOFTMAX的回归分析294.2分类器参数优化314巧.3本章小结第5章系统构建和实验结果分析345.1系统的整体框架和流程345.2图像数据集355.3分类结果与对比分析%5.3.1性能评价标准365.3.2分类结果对比分析%540.4本章小结.第6章总结与展望416.1总S416.2展望41致谢43参考文献44附录1攻读硕±学位期间发表的论文48附录2攻读硕±学位期间参加的科研项目49IV 式汉科技大学硕去学位论文第1章绪论1.1研究背景随着目前互联网技术与多媒体技术的蓬勃发展,人们开始通过音频、图像、视频相互交流,,传达信息基于互联网传播的多媒体数据也因此呈现出直线增长的趋势,。在依托互联网的信息交流中图像渐渐成为了人们信息交流、状态分享W及情感表达的重要媒介。这不仅仅是因为图像本身的纷繁多彩,更因为它在视觉上更加直观、在情感表达上更加的丰富。也正因为这样,人类能够从互联网上获取、下载、存储的图像数量日益剧增,随之而来的信息膨胀问题首当其冲需要良好的解决方一法,。面对着海量的图像信息资源如何进行有效而合理的组织管理和存储是项极具理论意义与实际意义的研究。与此同时,,在这些网络资源库中绝大多数的多媒体图像数据是完全没有任何文本标注的。如果单单只是依靠人工标注的方式对这些纷繁复杂的图像数据进行分类和管理是极其不现实的,而且这种方式也存在着费时费力W及效率低下等等问题。因此,如何采用合理、精确的计算机图像分类方法,对大量图像进行高效的自动分类一直是图像信息处理领域的研究热、管理及使用,点。一一图像分类就是通过定量的分析来代替人类对图像类别的判断,然后把它们W划入到对应的某种语义类别中。传统的分类方法包括:基于文本的图像分类方法2TB[](TextBased虹化geClassification,IC)、基于内容的图像分类方法(Con化ntBased口]Im巧eClassification,CBIC)、基于语义的图像分类巧emanticBasedImageWClassification,SBIC。TBIC主要通过手工,)对图像进行类别标记再利用基于文本关键词匹配的方法完成分类。显然,随着目前图像数据的持续增长,人工地为每幅图像添加准确的标记信息是不切实际的。CBIC则是采用图像本身所包含的信息,例如:颜色,并利用相似性匹配方法来实现图像的分、纹理、形状、轮廓、空间等"语义鸿沟"类。然而,在图像分类的研巧中,所面临的最大挑战就是SemanticGap()WWW,即颜色、纹理、形状等图像的底层特征无法充分地反映其原始图像的高层语一SBIC义。因此,该方法也存在定缺陪。则是从语义层上实现图像的分类,使分类结果在语义上更加接近,而不仅仅是所标注的文本关键词相同或者颜色、形状等特征上的相似,这样才能使得对图像数据的分类结果更加符合人类对图像信息的认知习惯。在此基础上得到快速发展的机器学习(MachineLearning)理论给解决上述问题提供了有效思路一。机器学习是人工智能研究中个重要的发展方向。它通过对人类1 式汉科技大学硕去学位论文自身学习过程的模拟,,让机器从大量数据中进行学习从学习过程中得到知识对未知的知识进行判断。简单来说就是通过训练得到图像语义的抽象表达,然后基于该WW表达,再对图像进行分类。不过,如何选取合适的机器学习方法、构造良好的学习模型,如何准确提取图像语义层信息,这将最终决定和影响图像分类算法的性能,。如何设计分类算法W提高分类效率W及准确率更为准确的学习图像语义信息成为当前图像分类的一个重要挑战。同时,如何实现对图像语义的有效理解,缩短图像底层特征与高层语义之间的差距,帮助人类有效管理图像数据也是目前较为重要的研究课题。1.2国内外研究现状近年来,随着数据收集渠道的增加和数据传播能力的提升,W及机器学习的发展,越来越多的学者开始投身到关于基于机器学习的图像分类研究领域之中,UW并且相继提出了许多图像分类算法。例如,19%年Vapnik等人提出支持向量一‘"机(SupportVectorMachine,SVM),将所有需要分类的点映射到个高维空间一""中,然后在其中找到个超平面。这个平面可W将这些点分开的,让不同类的点存在于平面的两边。SVM的关键在于核函数,很多学者也在此基础上提出了改进和应用何灵敏等人提出基于径向基核函数的SVM方法对遥感图像进tW行分类,该方法对于复杂的小样本多源数据的分类效果有显著提升。蒋芸等人一提出基于粗礎集理论的SVM算法来消除数据的兀余信息,定程度上减少了算法的训练数据,同时増强了SVM的分类能为此外SchairPACProb化lAroximatelorrect,p在yppyC)学习模型的基础上(fW提出Boosting算法,提高了其他弱分类算法的识别率。但是该算法在处理实际问题时,存在较大缺陷,不能很好的应用。Freund等在Boosting算法思想的基础一tW一—ABt上,提出了种优化后的算法daoosing算法。该算法定程度上解决,使该算法在现实应用中取得了良好的推广使用了关于学习正确率的问题。在机器学习中,ackProaton)神经网络也提出。许多学者关于BP(Bp巧i了很多改进一它由Rumelhart等人在1986年提出,是种按误差逆传播算法训练的多层前馈网19[1络。该算法通过训练过程自动学习网络的输入数据与输出之间的映射规则,具有高度自学习的能力。Cigizog山采用BP神经网络算法在底层特征的基础上运用P01机器学习的理论来得到图像的抽象表示。W上这些模型基本都是浅层机器学习模型,它们容易陷入局部最小值,难W达到最优的学习效果,对复杂函数的表示能力也相当有限,不能有效针对。同时2 式汉科技大学硕去学位论文 ̄ ̄多重的分类问题进行泛化。近年来,深度学习在图像特征提取、,针对这些问题分类领域得到了快速的发展,也引起了广泛关注。2006年,Hinton等人提出了深度学习,通过多个隐含层人工神经网络的学习将高维数据转换为低维编码,通过多层次结构化的处理过程,采用多层网络模型代替单层模型,用多层特征来获取图像更深层的隐藏信息深度学习模型的典型特点就是它的自学习能力非常强。同时,深度学习模型依托像素级的原始数据信息,,来提取数据高层的语义信息这样的方式也使得深度学习模型的特征表达能力相较于传统方式更加高效,它在图像全局特征的提取方法、准确可见上与上下文信息的获取方面有长足的优势空间。在此基础上,出nton等人提出了4Pj基于受限玻尔兹曼机(RestrictedBoltzmannMachine,RBM)。Vincent等人提出A口5]了找式消噪自动编码器StackedDenoisinutoencoders,SDA)。Salakh山dinov(g等人提出了深度玻尔兹曼机(De巧BoltzmannMachine,DBM),在网络深度增加的PW同时保持最大似然不变。Krizhevsky采用卷积神经网络(CNN,Convolutional一P71NeuralNetworks)获取图像的特征,并构成幅特征映射图来对图像进行分类。但是这种方法需要收集一定规模的有标记的图像样本构成算法的训练集。考虑到PS1这个问题,Pou化ey等运用未标记样本集学习得到了图像的特征表达关系。随〇8'后1^6666116〇^61?0破,08>卷积神经网络相结合,等人将深度置信网络(巧〇和口9]提出了卷积深度置信网络(ConvolutionalDe巧BeliefNetworks,CDBN),将深度神经网络对图像特征的学习能力又上升到一个新的台阶。针对该方法需要大量PW有标记样本对网络进行训练的缺陷,Le等采用基于稀疏自编码的神经网络从tW图像中建立其高层次的特征检测器。,Hinton合作艮BM和DBN在实际应用方面微软研究人员通过与,采用技术来训练语音识别声学模型,成功使得语音识别的错误率相对减低30%。2012年由著名机器学习专家AndrewNg和Google软件架构师JeffDean合作研巧的Gooerains,在图像glB项目取得了巨大成功。通过对深度神经网络的无监督训练没有任何标注信息的条件下,计算机自动学会了从数百万张Yo山ube视频截图中识别猫脸同年,Krizhevsky等人利用CNN技术在图像识别中取得重大进展,33N[]成功在Imageet评测上将错误率从%%降低到15%。2014年的1LSVRC2014PW比赛中,GoogLeNet构建了超过20层的卷积神经网络层数将化p5错误率降到一6.656%。层数越多的网络结构越难驱动底层参数的更新,在定程度上给预测误差的反向传播带了困难。GoogLeNet直接将监督信号加入到多个中间层中,训练使中低层的特征表示也能对数据进行准确分类,深度学习己经成为学术。可见研究的热点方向一,如何高效地训练神经网络模型仍然是未来的个重要探索课题。3 式汉科技大学硕去学位论文而且,在数据不断增长的情况下,利用深度学习算法来提高对数据分类的准确率具有非常重要的意义。1.3本文的主要工作本文主要采用了基于线性解码器的深度神经网络方法对图像特征进行学习。一同时,、纹理特,改变采用单的图像特征进行分类的方式同步提取图像的颜色征,优化深度神经网络中Softmax回归模型对图像的。根据得到的两类不同特征分类训练过程。通过两次分类过程,提高了对图像分类的查准率和查全率。该算法不但能适应各种图像数据特性,使两种特征提取方式相互互补发挥作用,同时对输入数据的分布无特定限制或规范。通过实验证明,该算法在准确性方面优于传统分类算法。本文包含的主要研究工作如下:1)在特征分析中,提出基于线性解码器的深度神经网络,并从原始的大图像中随机选择小块的图像区域作为神经网络的输入层数据,避免采用全联通方式使输入层神经元个数过多造成训练繁琐。巧采用卷积、池化操作完成从小图像的特征学习到原始国像的特征提取过程,根据神经网络学习得到的图像特征矩阵与传统的基于向量模型的特征相结合,进行Softmax回归分类和结果优化。3,根据提出的相应自动分类机制,在标准图像数据库的基础上与传统的特)征提取方法和分类方法进行试验对比,总结分析了本文算法在图像分类方面的优势和存在的缺陷,验证了算法有效性和准确性。1.4本文的结构安排,本文整体分为六章各章的详细内容如下:一章绪论,及其第。本章主要详细阐述了图像分类技术的研究背景和意义国内外在该领域内的研究现状。第二章图像分类研究综述。本章主要介绍了关于图像分类的流程W及深度学习的发展和应用。同时,对常用的多种相关性度量方法进行了详细阐述。第H章图像视觉特征分析与深度学习。本章详细介绍了基于线性解码器的神经网络提取图像底层视觉特征的基本原理和算法实现步骤,分析了卷积、纹理特征的提取方法。、池化操作的具体过程W及颜色第四章基于回归预测的图像分类算法。本章首先介绍了基于Softmax回归模型对图像的分类过程,进而介绍了分类器参数优化与图像视觉特4 式汉科技大学硕壬学位论文征结合进行分类结果判定的方法。第五章系统构建和实验结果分析。本章对本文提出的算法在公共数据集上进行了实验验证,并与传统分类算法进行了对比实验,分析了不同参数对实验的影响化及多种分类算法的实验结果。第六章总结与展望。本章对基于深度学习的图像语义理解和分类算法研究工一一作进行了总结,并进步指出了论文的不足之处和下步改进的方向。5 式汉科技大学硕去学位论文第2章图像分类研究综述2.1围像分类流程21世纪是信息的时代、互联网的时代,在日常生活中,我们接触的图像数据。当图像数据越来越多、种类越来越繁杂的时候信息量越来越大,人们自身甚至难W对这些数据进行有效的分类、整理。图像分类技术己经成为目前乃至未来的重点研巧方向。它通过已知类别数量,将大量图像分口别类进行整理。图像分类的过程主要包括:图像预处理、图像的特征提取、分类算法设计、图像分类结果的分析,如图2.1所示。像数据库预处理特征提取i分类算法设计分类结果分析)j图2.1图像分类过程1)图像预处理:预处理主要是为了减少图像中的冗余信息,并对有效信息进一化行突出显示或恢复。通常采用数字化、归、几何变换、空间变换和形态学处理等方法。经过预处理的图像具有较高的图像质量,降低了噪声等因素对图像信息的影响,使后续步骤的结果更加可靠。2)图像特征提取:特征提取就是通过向量的方式对图像视觉特征进行描述。通常提取的檐征主要包括颜色、形状、纹理等,!^^及通过神经网络训练学习得到的特征一。根据不同的分类方法合理的选择适当的图像特征对分类结果有定的影响作用。高质量的图像特征不仅要能够表达图像的信息内容,也需要对环境的改一定的鲁棒性和稳定性变具有。3)分类:关于图像分类算法设计,它的核也部分就是对分类算法的设计W及实现。根据图像之间的相关性及各种相关性度量方法的判定结果,在图像特征与图像类别之间建立映射关系,图像随之被分口别类到预定义的类中。然而,图像分类存在的语义鸿沟问题使得计算机算法很难建立完全准确的映射关系。而且,各类算法之间的差异也会对分类结果造成比较大的差异。在图像分类研究中,如何设计适用的分类算法是十分值得研究的。4)分类结果分析:在得到分类结果后,需要根据制定的评价标准来客观分析分类算法的有效性,比如每个类中包含属于该类的图像的数量、每幅图像是否分6 式汉科技大学硕去学位论文类到对应的类中。同时,总,与多个不同分类算法作对比结分析优缺点和改进方向。2.2传统神经网络M-PMcCullo化等人对神经元基础特征进行了分析研究,首次提出了神经元35一[模型]经网络领域的研究发展起到了,对神定推动作用。人工神经网络研究领6"P一一—。Rot域进入了个新的局面随后,senbla诚功提出了种多层神经网络感"知机(Perceptron),将神经网络由算法理论阶段推向到实践中。2.21.基本思想P7W^神经网络的研巧起源于19世纪末,aldeyer等人创建了神经元学说。其中,神经细胞的结构如图2.2所示。它由细胞体、树突和轴突构成。树大突啟图2.2神经细胞结构当来自其他神经细胞的信号传递过来时,信息首先通过细胞中的树突进入该神经细胞。由于神经细胞的树突朝着各个方向生长,并且它本身也有许多分支,这样的特性使得神经细胞可接收来自各个方向的信号,神经细胞通过对。然后"兴奋"""信号的处理激发该细胞进入或者抑制状态。随后该状态变为电信号,并通过它的轴突传递给其他神经细胞。这是神经细胞的简单工作原理。在人类的神经系统中有上亿个W上的神经元,它们彼此通过轴突和树突连接形成了复杂的生物神经网络系统。通过这个系统,人类接收到外界的各种信息,并协调全身的技能活动W应对这些信息。可见,神经细胞的相互作用和信息传递使生物的神经系统具备难置信的能力。受此启发,人工神经网络在结构上与信。号传递方式上对神经细胞进行模拟。人工神经网络中的神经元模型如图2.3所示1.<:.;:_^,右边的^则为输出。图中左边的枯;..(...为模型的输入,,,12,,},,,7 式汉科技大学硕壬学位论文/X。图2.3神经元结构对于信息;C,设它与该神经元的连接权重值为W。那么,该神经元的输入可,,?表示为成。图2.3中间的/表示该神经元的激活函数,显然可得到;的计();算公式I[下;-02-产/(1)l,f^]平V片1J其中,0为处理单元的内部阔值。在完成输入、输出参数计算后,就需要对网络进行训练,常见的训练方式包括感知器训练、delta规则训练和反向传播算法*AV—U导|方^或。2.2.2BP神经网络在传统神经网络中,比较典型的网络结构代表是BP神经网络。它在结构上表现为有向无环,主要包含H种层次类型,分别为输入层、隐含层和输出层,如图2.4所示。8 式汉科技大学硕去学位论文i:ii输入展王隐巧區左输山层王123图2.4SP神经网络BP神经网络是一种有监督学习方式,主要采用反向传播算法和梯度下降的学习规则,属于多层前馈型神经网络。外界的输入信息主要通过输入层与的各个神经元进入神经网络;为隐含层,它接收由输入层传递进来的信息,并对它进行处理输出层一,它处理来自隐含层的信息;与为,进行进步的信息处理。这是通一过输入层到输出层的方向计算实际的输出,般称为正向传播处理过程这个方式。然后,通过输出层到输入层的方向来不断调整网络的权值和阀值,这个方式也叫误差的反向传播,最终的目的是为了使网络的误差平方和到达最小。此算法的具体步骤可描述如下:假设训练集为乂=切,兩而...而...,;〇,其中"!表示训练集的大小,义表示训,练集中第/个训练样本。同时,设网络的输入层为第1层,输出层为第L层;在数据传递处理过程中,将当前层记为/层经元个数设为。,它包含的神&?一那么/-,第1层表示当前层的前层,设巧为该层第y个神经元与当前/层第;??/个神经元之间的连接权重,却为当前第Z个神经元的偏置量,则第/层中的第Z个神经元的输出为:"=&'2-2,?/(/〇()?通常采用s其中,为神经元的激活函数imod函数/(),g,即:9 式汉科技大学硕去学位论文/W=2-3:r^()1+e—双曲正切函数同时,也常采用非线性激活函数,表达式如下:=-4口)e+eSigmod函数与双曲正切函数的图像如图2.5所示。从图中可见,sigmod函数-的取值范围为(U],而双曲正切函数的取值范围为[U]。[巧■丘抓SB—,J——-—-- ̄ ̄1*■*?''1r1::rTn-1一/06■-SSr//,■-./ef/04-。0’-at/.2j/化■.-0/^-々.-/.2.々?.d3^/.4/e-../.s/々怎氏一./.,/々.8.1-..V<02,6f2S<5-.4...45321D1335图2.5激活函数图像’<-5在公式(2中,/个神经元的输入值/表示第/层第Z,计算公式如下:),’=+6-^25S的皆/()M通过上述公式完成数据信息的前向传播后,BP神经网络开始针对参数进行误7;=;差反向传播过程。设向量......{义,72,>,是输入为训练集义时,图像集;,乂,,;。}合各个样本所对应标记的期望输出值,.为对应输入为;C.时的期望输出。同时y,,,一=设22,,2,,...,2,,...,么。}为神经网络的输出向量。则对于训练集中的每个训练样{本X.,它的训练误差如下;,01 式汉科技大学硕去学位论文2=-Z-巧乏(!乂)口巧每=则在整个训练集义;C;C…;C...,可W!知,,3,,,,得到总体误差函数为2,而}中2=-怎=2-7(1>,1!乂)):1>.去^二1=,Mk\<同时,根据误差梯度下降法,通过^下公式对神经元之间的连接权重^^化及;神经元的偏置量6/进行参数更新:巧P哨=听-a口哨兩-6=6a2-9//()赛一。其中,a表示学习速率,它表示每次参数更新时权值的变化量则对于单个训练样本,输出层的权值偏导数レ义及偏置量的偏导数计算公式如下:=Z-口10八)薦兩掉(刊-養=端妒却口-…而对于隐含层,显然可W得到权值偏导数与偏置量的偏导数如下:=T叫口-巧聲诗睹(叫11 式汉科技大学硕去学位论文旅51\2fii^一1,、Z-於()(*)雨雨4這J'-_=z-、-、-、-令沪()/的对公式1011I2I3进行简化运算,i。口)口)口)口)乂I,乂表示学习速率:设7,计算权值更新公式如下i=-WWrSx2-14yyji()更新权值后,交替进行前向传播过程与反向传播过程,直到误差小于阔值或者迭代次数达到预先设定的值时结束。BP神经网络一算法在理论研巧和实际应用上都取得了定的成功,但是该算法容易形成局部极小值而造成得不到全局最优值的现象。而且在研究中表明,训练PSi。次数多使得学习效率低,收敛速度慢2.3深度学习简介传统的神经网络主要是采用了反向传播算法,该算法实质上是采取了迭代的方式进行计算,并通过神经网络的输出与输入值的期望输出间的差别来更新隐含层的参数。随着顶层不断向下,误差校正信号越来越小,尤其是从远离最优区域而且一后,很容易陷入到局部最小值,这种网络般采用有标记的数据来训练,;但是实际操作中大多数的数据是没有标记信息的一。因此,计算机需要进步模拟人脑的运行过程和结构,就需要高度复杂的神经网络来完成。深度学习的提出,为解决上述问题提供了全新的研究方向。2.3.1基本思想PWW一深度学习的主要优势在于它可W自动学习特征。假设设计个图像数据?=...,层特征提取的系统S;并将它表示为S其中表示S的第i,,,,口&&}&如图2.6所示。并设输入为/,它经过系统5层层处理后,输出为0。通过不断地0与/保持一。调整系统各层中的参数,使样那么,该系统就能自动获得输入图■像/的特征一。W这种假设为基础代表着/经过5时,图像信息在每层都没。一=有任何损失。这也意味着,S巧......层所获得的持征都是对原1,&,,&,,&}中每始输入一/的另外种表示。12 式汉科技大学硕去学位论文Sss&],_、?图2.6系统S模型一然而,这只是种理想状态。无论是哪种信息处理方式都会在处理过程中丢一失5一一部分信息,无法保证系统的输出与输入完全致,。因此定条件的放宽,让输入、输出的差别尽可能减小,尽量使丢失的信息为输入信这个限制,同时息的兀余信息即可。深度学习就是在这种假设条件的基础上,通过构造多个层次结构,使当前层的输入全部来自上层的输出,实现对系统输入图像的分层表示,即完成了自动学习特征的过程。2.3.2训练述1概述一一如果对系统5的每层同步进行训练,会定程度上造成时间复杂度上升。一一相反,每次只加入系统某层进行训练,那么每层产生的偏差就会向下层传递;一而由于深度学习中的神经元个数般较多,就会造成很大程度上的欠拟合,严重影响特征学习效果。鉴于上述问题,深度学习采用自底向上的非监督学习和自顶向下的监督学习两个步骤完成特征学习一自底向上的非监督学习步骤如下,:首先采用未标记数据作为系统5的第一层的输入,,,训练并学习参数;然后将该层的输出直接作为下层的输入并训练学习当前的参数;随后,不断的重复上述过程,直至训练并学习完第&层的=参数最后,得到系统5.5....。..;,,,,,通过完成自底向上的非巧&;&}的各层参数监督学习过程,可得到比原始输入信息更加具备表示能力的图像特征。而自顶向下的监督学习部分,则是通过利用自底向上的非监督学习到的各层=.参数对系统5*5.....。,,,,具体来说,深度学习把除巧;&,&}的各层参数进行调整一了顶层1^外的所有层之间都设置为双向权重;然后利用学习的特征和向上层传一递的权重,通过梯度下降法修改层间的向下层传递的权重;同时,通过底层的状态修改该层中向上的权重。13 式汉科技大学硕去学位论文 ̄ ̄在深度神经网络的参数初始化过程中,并不是采用与传统的随机初始化方式,而是通过对输入数据的学习而得到。这个初始值更接近全局最优值,送是深度学习训练过程相较于传统神经网络的优势和特点。2.4困像分类中的相关性度《一。在图像分类的研巧中,样本相互之间的相关性度量是非常重要的部分在分类算法里一,距离更加靠近的样本会划分到同个类。这也显示出相关性度量标准在一定程度上影响着最终图像分类结果。近年来,在图像分类领域中常用的度量算法有W下几种:(1)欧式距离,主要计算空间中两个点之间的真实距离。设图像:\y的特=征向量分别为...和方.,而,也,,相其中d表示特征向量维{},数,那么不与义的距离公(《.义表示为;,)/^—-£>X'=Xx15,)口)化j松inJ(2)曼哈顿距离,它是用来表示两个点在空间坐标系中的绝对轴距总和,计算公式如下:=--公16(《,不)Ek气口)。I=nl一(3)闭式距离,由数学家巧可夫斯基首先提出,它代表着组距离的定义,计算公式如下;〇=—-尤17)巧,)口,拉K节"r当乂取值为1时,该计算公式则表示为曼哈顿距离;当;I取值为2时,则为欧式距离。(4)马氏距离,它的计算是基于总体样本的,主要用来表示数据间协方差距14 式汉科技大学硕去学位论文离:,计算公式如下=-£).乂(《,)。1巧,如万)可石马其中,S为总体样本的协方差矩阵。(5):余弦距离,它主要表示两个向量方向之间的差距2-。19斯瑞()2.5本章小结本章内容是对图像分类研巧的综述,首先简单介绍了图像分类技术的研究背一些图像分类算法及其简单应用然后详细阐述了关于,归纳总结了近年来的景;神经网络算法的来源W及有关的基本思想。同时,简单巧纳了神经网络在图像分一类上的发展进步,并且进步对传统神经网络中的代表性算法(BP神经网络算法)做了详细分析与介绍;之后,简单介绍了关于深度学习的思想起源、针对传统神经网络的改进与优化W及大致的算法概况;最后,对图像分类中的相关性度量方法做了简单说明,为之后的研巧提供理论基础。15 式汉科技大学硕去学位论文第3章困像视觉特征分析与深度学习义1围像传统特征提取在图像分类的研究工作中,传统方法主要采用来自于图像的底层视觉特征,依靠人工设计规则进行提取,例如颜色、纹理、形状等等。这些特征虽然是基于计算机对图像的计算而得到的,但是实质上这些底层视觉特征大多是人工设定的一定程度上属于人工提取的图像特征计算方法,。3.1.1顔色特征一颜色特征是种全局视觉特征。虽然它对图像颜色区域所在的方向W及该区域大小等属性的变化不能很好的表示,对图像中局部特征的提取能力有限。但是它的优点在于,当图像本身的尺寸发生缩放、方向被旋转或者观察视角改变的时。候并不会对颜色特征造成影响,具有较高的鲁棒性本小节从W下H个方面提取图像的颜色特征。1)颜色直方图数据集中的数字图像大多数都是用RGB颜色空间来表达的,如图3.1中图a)所示。RGB颜色空间中R、G、B分别代表red、green、blue。坐标原点化0斯表—红,且、绿、蓝。可见示黑色坐标轴上的H个顶点代表三个基色,每幅彩色图像都可W分解到H个独立的基色平面上。y|ab))困3.1颜色空间一而颜色直方图般是采用HSV空间,它更接近于人类在视觉上对颜色的主观认识,该空间如图b)所示。在HSV空间中,H个分量分别代表色调(Hue)、饱和度(Saturation)和亮度(Va山6)。亮度与被观察物体的发光强度有关。色调则16 式汉科技大学硕去学位论文表明了颜色本身的种类和基本特性。对于亮度与色调相同的颜色,饱和度用来区分它们之间的深浅差异。因为上述原因,需要将RGB颜色空间转换为HSV空间的表这形式。首先,分别计算出H种基色值相应的H、S、V的值,计算公式如下;V=max/?G5,,()=_mSFin化G公/F(,)[]'欠=F--/rminAG公,[叫[扣('--G=F/rmin/2GS,,[巧[W('=--mSFS/rin度6度[][,,知(__'口〇=5+公if=maxG公&GminRG公矿(A,)C,,)-=及1伊!i?maxG,巧G*minG/(化(化,巧'=1+巧G=mxmna度G&公i欠G(,,,巧沪,巧(-''-=3公zmax乂G公&公*minG/G(,,)(A,巧'3+G=max巧G公&及=minG公沪公(,,)(i?,,)15-民〇化envise再将该空间划分成若干个小的颜色区间,然后针对每个区间计算颜色落在其中的像素数量。2)颜色矩Strieker的颜色矩理论表明,在图像中每种颜色的分布信息都能用它本身的矩一来表示。因为主要采用低阶矩,所W通过计算颜色的阶矩(mean)、二阶矩(variance)和H阶矩(skewness)来提取特征,计算公式如下:=3-2八巧()去1122=-3-3巧SM()去(与)3-S=3-4i诘记4()17 式汉科技大学硕去学位论文一?表示二H阶矩表示为。AT其中,//阶矩,阶矩,为灰度级数,,巧为A巧表?示像素点在第。/:个颜色通道分量上的值_3)颜色聚合向量rn一图像颜色聚合向量(colocoherecevector)是在颜色直方图基础上的种进化,它用来表达色彩的空间位置。如果直方图中第颜色柄内的某些像素所占面积。湿大于设置的阔值,那么该像素记为聚合像素,反之则记为非聚合像素然,颜色聚合向量为;"-"'"......5A’A,2,片2),’(’’,口)1々),(。A)〈()(〉其中,设《、,巧分别代表直方图第个颜色柄中聚合像素的个数与非聚合像素的个数。3丄2觸雛一种特性纹理代表了物体表面的,即图像在灰度空间的分布信息。它不是基于像素点得到的特征,而是综合了图像表面上的结构信息W及多个像素点的区域一特性进行统计计算而得到的特征。它不仅从整体上把握了图像的全局特性,还定程度地兼顾了图像的局部特性一。由于它是基于统计量的种特征,它的值不随图像的旋转而发生改变。本文算法提取常用的Tamura纹理特征,主要包括粗糖度、对比度和方向度。1粗糖度)一种特征粗趟度是纹理中很重要的,它主要由其模式结构和基元尺寸而决定。当图像中纹理模式结构相同时,其基元尺寸越大,则该样本粗礎度越高;当图像的纹理模式结构不同时,基元尺寸的大小和基元尺寸的重复次数都对图像的粗趟一定的影响度有,并且呈正相关性。首先一口tx2t,假设个活动窗大小为2,计算其中所有像素的平均强度值x,显然:4t_y(,)*-*-',王+2--l1+2y2*=2-64片>0ZZg(U)/(3)18 式汉科技大学硕去学位论文’’。其中,gzZJ的像素强度值(J)表示图像上坐标为()一然后,针对于图像中出现的每个像素点,根据^^^下公式计算它们在水平方向W及垂直方向上:,相互之间不发生重合的窗口之间的平均强度差-*-1*!--=X-XX+232如7,y),y(()毎*(()A|*_*-11=--X-X+228,V,托y)口)(_)4()|。&,向上的平均强度差同时,,,代表水平方向上的平均强度差&,,代表垂直方-结合公式(36)、(3-7)与公式3-8£,计算得出使取得最大值时的A值,并设置()*=该活动窗口大小的最佳尺寸为JCF2。,_()最后,通过计算在整个图像中得到的各个求其平均值巧即该样?本的粗糟度:丄.S-!J39艺艺U)()mxn苗苗2)对比度对比度是指一幅图中亮度差异值,该值越大代表对比度越大,反之则代表对比度越小一。般通过计算各个像素邻域的均值、方差W及峰态来得到图像的对比度。首先计算图像灰度的峰态《:4"=3-。104与()<7其中,A代表四阶矩均值,C表示图像灰度的标准方差。在计算得到峰态后,可W进一步得到对比度19 式汉科技大学硕去学位论文口-。看)3)方向度方向是图像的重要特征,它详细地描述了图像中的纹理是怎样沿着某些方向分布或者聚集。同时,它与纹理基元形状及分布的规律有关,因此,Tamura纹理特征采用方向度的计算方法来度量图像是否存在明显的方向性信息。首先,计算图像中各个像素点所在具体位置的梯度向量的模AG和该像素点||的局部边缘方向,计算公式如下:AG=A^+3-fAF/2(1巧||(||||)-,0=T-tanAF/M+;r/2(3巧()其中,A//是图像中该像素点周围矩阵区域大小为3x3的部分,与图3.2中图a)的算子做卷积运算得到的水平方向上的变化量;AF是图像中该像素点周围矩阵区域大小为3x3的部分,与图3.2中图b的算子做卷积运算得到的垂直方向上的)变化量。---101111-101000----101111ab))图3.2算子然后W:,构造基于该点局部边缘方向值的直方图表达式。Hk=k-DNN(314)[)e[)&eij)=10其中,设置阔值为f,表示当梯度向量模AG含f时的像素点的数量。||20 式汉科技大学硕去学位论文再计算直方图巧中所出现的峰值尖锐程度,该公式如下所示;52=-好3-15&.口口口),艺E(,)。()(P口ewp3-公式(15用来表示图像总体的方向性信息,7为//中的峰值,其总数用U)/&p表示。对于直方图中的峰值/?,用W表示峰谷之间该峰值的量化值范围,而口则pf表示该范围内的最大量化数值。3.2基于深度学习的图像特征分析在实际中,人工提取的图像特征存在或多或少的缺点。例如作为全局性特征的图像颜色特征,它对于图像的颜色信息确实能够很好的识别,但是它对于图像区域的形状、大小不具备分辨能力。比如苹果和懐桃在颜色上的表现就十分类似,然而它们在实际中的大小比例存在巨大的差异。但是,这些差异只依靠通过颜色特征无法表现出来。同时,纹理特征也会因为图像当下不同的光照条件而对提取一结果产生定的噪声影响,;而不同的观察角度也会对图像的形状判断产生偏差。这些影响都会对图像特征表达、语义理解带来误差。因此,需要在基于人工提取的底层视觉特征上,加入更能精确表达图像语义的特征信息。基于深度学习的图像特征提取,近年来受到大量学者们的关注。同时,它在语音识别、图像分类等诸多领域取得了巨大成功。它提取的特征全部来自于对数,而不是传统的人工设计的特征,据的学习。而且基于深度学习的特征提取与图像分类器是结合在一起的,可W同时优化使分类性能得到最大程度的提高。本文针对基于稀疏自编码的神经网络对数据输入范围的限制问题,提出了基于线性解码器的深度神经网络方法对图像特征进行提取,并与图像底层视觉特征相结合进斤分类器的训练。3.2.1基于线性解码神经网络的特征分析一在深度学习中,稀疏自编码(SparseAutoencoder)是较为常用的种算法它通过隐含层的激活度来表示输入层的激活度,同时,在输出层将送些信息进行还原一。显然,该隐含层上包含的信息就是对输入层的数据信息的种压缩性的表一示。然而,稀疏自编码对输入数据信息的波动范围有定限制。因此,本文采用earDecoders)在此基础上改进而来的线性解码器(Lin。21 式汉科技大学硕去学位论文 ̄ ̄一线性解码器是种无监督学习算法,采用未标记的图像对网络进行训练。训练中主要采用反向传播算法,通过对参数的不断优化。,使样本输出值等于输入值基于线性解码器的神经网络结构与稀疏自编码类似,主要由H个部分构成,如图3i入层(La.3所不,分另j为输yer左)、隐含层(LayerZ)矛日输出层(Laer)。]y1与義動/?…一LayerLaerLaerLy王,yj图3.3基于线性解码器的神经网络结构=假设集合义义义......,,.,表示未标记的图像训练集,其中为训练枝1,2,3,和而},集中所输入的第/幅图像样本,W为未标记的图像样本的数量。向量=^..,.....表示输入为数据集义时从,於,於,,7,,,於}图像集合所对应各个训练样本?的标记期望输出值,其中,,义表示输入为第Z幅图像时的期望输出值即对应第/幅图像的期望标记信息一。在线性解码神经网络中,主要是通过个复杂的假设模型对参数进行更新求解。其中,、6(X)代表输入为J时的假设输出,W为权值向量,6为偏置向量。整个网络就是通过参数W、6来拟合数据,同时使该网络学习输入层数据的近似表示,特征学习的目标就是求解参数W和6。首先,计算各层中神经元的输入值。设连接第/层中的第y个神经元与第/+1层中的第Z个神经元的权值向量参数为w,并将连接当前层/的偏置单元与/+1层中f??>的第Z个神经元的偏置向量参数设置为皆。则可W计算得到第/+1层中第Z个神经元输入值的加权和,公式如下:'+。=+-4wX316艺炒()jpj=>122 式汉科技大学硕去学位论文。,其中,代表在第/层中除去偏置单元W后的所有神经元的数目另外与BP神经网络类似,基于线性解码神经网络也是通过激活函数来计算神经元的激活度。在该神经网络算法中,/〇表示神经元的激活函数,则该网络的第/层中第/个神经元的激活度可通过下式计算得到:'())=-。317,/皆()()其中,该网络采用的激活函数为sigmoid函数:= ̄/z3-W()^(71+e当某个神经元的输出值接近于1时,则该神经元被激活;而当它的输出值接近于0时,该神经元被抑制。显然,假设在输入为X时,可将该隐含层神经元,_/的激活度表示为afh.)。那么,在输入的训练样本集上就可W求得该隐含层神经元/的平均激活度为:_A2=丄-。.319^却!心,)]()L」W.=,1=然后,通过引入稀疏性参数pW及限制条件A.p,使隐含层中神经元y的平均激活度接近于0。同时,这样做也能够将隐含层中除去偏置单元外的所有神一一经元的平均激活度维持在定范围内,。显然稀疏性参数P是个在数值大小上-与0相接近的值,319),。因此当公式(取得最小值时能够近似达到限制条件二。台Pj随后..,可,对于每个输入样本xW及该样本对应的期望输出值义其巧义方,差代价函数如下:=—-20■/W6JC.巧,(3,,)(巧乂)如、A()乂23 式汉科技大学硕壬学位论文 ̄ ̄ ̄则对于训练集义和期望输出r,可W计算其所有对应样本的代价函数的均方差作为该网络整体的代价函数,计算公式如下:丄/w6=/'???w如,,口心)()芝(,乂)w=L'1_为了防止该代价函数^^过度拟合,在此基础上添加权重衰减项^2兰来加W控制。其中"表示网络中的层数,义为权重衰减参数,用Z乏£诚,(、)2=/】片。来控制均方差项与权重衰减项这两项的相对重要性同时,为了防止当平均激活度^和戶有显著不同,而影响神经元的平均激活度A的范围,加入基于相对赌的一惩罚因子W此来进步实现对线性解码神经网络的稀疏性控制。=ij那么,W为均值和W为均值的两个伯努利随机变量之间的相对摘可通过下式PA计算得到:=-促0'/?1〇3早^1句雌片3心)心今()P1-jA由上式可明盈得知,当p等于A时相对備紅取得为0,且该值为它的最小值;而当平均激活度A和稀疏性参数/:)的差异相对增大时,相对赌则会随它们的差异增大而显示出单调递增的趋势。同时,相对媳iapD会在平均激活度的值无限接近于0或者1时,不断地接近于无穷大。(A)A综合上述各式,可W得到新的代价函数公式:)=-?-八如日、'川++片|片1〇8(323))々h)ZZZ4占巧垂()^素占含24 式汉科技大学硕去学位论文其中,加入控制稀疏性惩罚因子权重的参数片,来控制H项间的相对重要性。3-20)显然可知入的训练集乂和通过公式(,代价函数的值越小,表示输期望输出F相对越接近;反之,表示输入的训练集X和期望输出7相对越偏离。因此,可W通过求代价函数JOiA的最小值来确定权值向量W和偏置向量占。)那么,则需要计算代价函数对权值向量W和偏置向量6的偏导数一-/w6レw6。;cッ及J;c为此,定义该网络第/层中的第/个神经元,,;^(,;パ^(,パdwd巧,y--。316317)对最终输出值的误差产生的影响为残差,记为of根据公式()、(和(3-23),可得该残差为:')叫(>=+公-孚+z-24却:。)吃心的,^KlV()而在输出层,不同于稀疏自编码的残差计算方式,在线性解码神经网络的输=,出层采用线性激励函数,即/Xzz。显然该网络输出层神经元的残差为:);巧巧=-乂-*3-2引()(-由公式323)、(3-24)显然可得隐含层的残差计算公式如下(,:)’二--旱+-26皆化?却片)WfIV例。一在根据计算公式计算得到每层网络所有神经元的残差后,则可求出针对权值向量W和偏置向量6的偏导数值,该计算公式如下:w=?/,,如_y品()dw/‘3-27/()=?/w如,硕(25 式汉科技大学硕去学位论文然后,根据得到的代价函数W及其偏导数的基础上,采用梯度下降法来计算该网络的最优化权值向量W和偏置向量6:,可W得到其梯度下降方向分别为''()")= ̄.)▽vvV+义W()、,W<-28(3)+''!(())丄V6=菱>'W=1,.在其梯度下降公式-(328)的基础上,通过设定迭代次数来不断减小整体代价函数的值。待算法收敛或者迭代次数己经达到设定的值时,停止计算。在。得到权值向量W和偏置向量6后,即完成了该网络对图像特征的学习部分另外,-由公式(3、(-16)317)可计算得出令隐藏神经元得到最大激励的输入值为:口心)I运用上式计算出所有隐藏神经元得到最大激励的输入值么后,可w将它们组成一幅图像从而使图像特征可视化。3.2.2基于部分联通网络的卷巧特征在得到权值向量一步则需要计算得到训练集与测试集W和偏畳向量6后,下样本的特征矩阵。在基于线性解码神经网络的特征分析中,作为网络输入层所输入的训练集样本,是基于数据集中原始图像大小而抽取的局部图像区域。这是由于基于深度神经网络的方法,需要训练网络中各层所有神经元的权值向量W和偏置向量6。然而,权值向量W和偏置向量6的个数则与原始图像分辨率的大小有xa关。假设图像样本的分辨率为a,如果将整幅图像的所有像素点全部作为输入层的输入信息一个像素点都必须对应一显然,那么图像的每个输入层的神经元,该层2需要的神经元个数为a;同时假设该网络隐含层神经元的个数为片,则该神2经网络需要学习的权值向量W和偏置向量6的数量为《含。可见,数据集样本的26 式汉科技大学硕去学位论文图像分辨率大小a,直接影响着该神经网络所需要学习的参数数量。同时,它也间接影响着所有参数训练的时间复杂度。旨为此,本节提出基于部分联通网络的卷积算法,P:在原有全联通网络基础上经元只连接输入层的一,使神部分神经元。具体来说,通过对初始的图像训练集样本进行切分一,将所有输入的图像切分成若干个小尺寸区域构成个区域子集。然后,将该区域子集作为网络输入层的输入。最后,将该算法得到的特征与原始图像数据集做卷积、池化运算,得到最终的数据集的特征矩阵,将该矩阵作为图像分类器的输入。=假设集合nzr,z,。,...,&,c,...,z,c表示有标记的图像训练集样,,i)(;)(,{()(^本,其中/用来表示己标记的训练集中样本的个数己标记样本集Q。同时,假设该中的图像分别属于A个不同的类别,表示训练集Q中的第幅己标记的样本图像,则表示该第川畐己标记的样本图像所对应的类别编号。另外,假设未标记的二图像测试集为5?5...5...5。其中,5.表示测试集中的第/幅未标记的样,,,,,,,,?[},本图像,,:表示测试集中样本图像的个数。同时,假设数据集Q和5中图像的分axa一辨率为。然后,在数据集每个样本中随机选择多块分辨率为6x6的个局部小块图像。将选取的所有局部小块图像组成数据集义=林,;(:,:\:,...,...],并,。,^车,,将该数据集作为基于线性解码器神经网络输入层的输入信息。,3.1然后根据节中基于线性解码神经网络的特征分析算法,通过计算得出基于该神经网络的所有权值向量wW及偏置向量6。然后利用从输入的图像训练集=^义....,枝八2...,,数值并^1作为卷积运算的步长对训练,义3,,,而,}中学习到的参集QL:i?及测试集5进行卷积运算。那么,将在图像训练集〇1^及测试集5上完成卷积运算之后得到的特征矩阵分别表示为化,。。,和化。其维数大小、,,,,_Ax--6lxl。,均为fl+a6+其中^表示隐含层的神经元的个数。()()M然可见,矩阵化和。的维数相对较窩,直接输入到分类器。,w,w中进行训练是不太适合的,,。因为维数过高训练时很容易出现过拟合的现象从而会影响训练之后的分类器对图像的分类效率,。因此本文采用池化操作来解决一这问题,即;通过计算图像各个区域上的特定特征的平均值方法对图像不同位置的特征进行聚合统计。除了可W计算平均值外,还可W计算图像各个区域上的特定特征最大值。另外,池化操作必须作用于图像中不重复的区域内,设置特征池化操作的区域的大小为,计算矩阵化。和。在区域大小为CWWTW,.内的平側直,抑何W导到池化后的特征組卑和公。。/A。,。,27 式汉科技大学硕去学位论文3.3本章小结一圍像特征的提取是对图像分类结果有重要影响的因素之,本章重点介绍了一本文图像特征提取算法。方面,对基于线性解码神经网络的特征学习做了详细介绍,包括该神经网络的构成形式,各层参数的传递更新过程,W及卷积、池化一的操作方式。另方面,本文算法采用传统图像特征提取与基于线性解码神经网。络学习的特征进行结合。最终,两类特征相结合生成数据集的特征描述向量28 式汉科技大学硕去学位论文第4章基于回归预測的图像分类舞:法一、回归预测属于有监督学习中的种方法,它的核也思想是研究分析本身具有相关关系的变量之间的变化规律一,并得到个数学模型;然后通过这个模型对数据进行预测或者分类。本文在Softmax回归预测的基础上,通过利用得到的两类特征对Softmax进行分析训练,采用多步分类的方式得到最终测试集中未来标记样本所属的语义类别。4.1基于Softmax的回归分析='将通过神经网络学习得到的训练集0/......2/的2,;片,1,,,,仁,4,,{)仁)(分特征矩阵公作为Softmax回归模型的训练样本,且该样本属于&个类别,一则假设样本属于每类的概率分别为如...。显2...,满足条件:捧,,為然概率<\,在,,故4-(U=1/-同时,引入A个ytl维的向量表达式戸心,其中)来表示样本的标记信息'-ll0〇「]「0107==...=-107X20rw042()),,()0〇〇_」[」[_因为本文研究的图像分类问题中一,每个样本必定属于其中个类别且只能属一一于个类别,所向量了心中只能有个元素值为1,其余元素全部为0。那么,)29 式汉科技大学硕去学位论文’==引入指示性函数1^1,它的取值与yZ的逻辑真假相关。当它的值为逻辑真}====z。显然时,lyl;反之,它的值为逻辑假时,lz0,可W将W上A个j}{^’一-==A1维的向量表达式统表示为ri3;t。为了方便算法的推导过程,定((y)),{}=?lo:义巧g,则对…求和可得与4,如,众众=-\43私如()=11根据公式(4-1)和公式(4-3).,可求得4的表达式如下:巧6=—4-4也k()电2>=然后,设置8〇化11化的回归参数为00...,同时满足巧义。那么,可,,,12巧皆推导得到回归模型的输出期望值.,将该期望值设为假设函数A,其表达式gk);如下:和'=lz.0ef);(C,|pk.=2於‘)M々瓜==闕)击?S沪:=1pr.=kzre/,沪_[)\_一其中=..oftmax,表示对于输入的每个图像样本z,该S回归,,非,n)()一种分类结果出现的预测概率值模型对其每。为了求解其所有的训练参数值,设30 式汉科技大学硕去学位论文置其对数似然函数为假设函数々.的代价函数,其定义如下;0^):王1tk巧‘p=-—0=-l?^〇46()*/gn^():咕}f=='wi和,玄g=!.1_.=表示为指示性函数==公式中1;,当它的值为逻辑真时,11,;反之^_1^;八它的值为逻辑假时.==〇。为了,iby防止模型中参数的兀余,并对过大的参数}:值进行惩罚,在代价函数中加入权重衰减项来对其进斤控制,得到新的代价函数*--47斬0==1。+()叫)41:1%*/}垂11砖菩^(==2==0,1y1巧/^,y色=/1-_然后,对该回巧模型的代价函数求其偏导数为:-=--▽0Z==048+乂0)e;((),咕*/。水(}八))/[]_/這通过运用梯度下降法迭代得到《/0的最小值,求出参数0...得到完成1,马,,巧()训练之后的Softmax回归模型。4.2分类巧参数优化在得到该回归模型后=^,将未标记的图像测试集54&...4...,作为该模,,,,,{;)一型的输入-5S个样本对应各个类别的。该回归模型通过公式(4)计算得出中每一概率值。在常用Softmax回归模型中,般选择对应概率值最大的类别作为图像分类预测结果并输出。然而,,在对回归模型的训练中存在着不可避免的参数误差一、定程度的参数冗余W及训练过拟合的现象。因此,完全依赖概率值最髙的一一预测类别作为判断结果可能存在定误差一。另方面,单地使用基于线性解码31 式汉科技大学硕去学位论文神经网络中学习到的特征对Softmax回归模型做训练,得到的分类结果会被上述。因素影响。为了解决上述问题,本文对分类器参数进行优化max对于所有图像测试集的样本,作为Soft回归模型的输入计算出的预测概率A。将所有概率值由大到小排列得到每个样本的概率向量C,它表示对第gh!)i//。个样本预测类别,同时其预测类别概率值排在第y位的类别编号一次分类然后,引入参数W来对图像样本的预测类别做第,得到图像新的预:测类别的向量,计算公式如下=〇<份4-9巧与/)()显然一,,第次分类将样本预测概率值的排位在后的类别进行舍弃即针对每个样本Z,它们的类别预测结果由A个类别减少到《个类别,且该份个类别构一成个预测结果候选集记为G;=-....410GG,G,,Gw(){i2}然后,设从图像训练集和测试集中所提取的颜色特征与纹理特征构成的持征矩阵的维数均为/^,在包含m个有标记图像的训练集Q上可得到视觉特征矩阵mxnx*fJ£□,同时在包含?个未标记图像的测试集S上得到视觉特征矩阵公e□。计算特征矩阵^中每个类别在每个维度上的持征平均值,构成参数表达式集合=a其中表示类别编号为&的平均特征向量值。设&.,《表示矩阵公1一个样本的特征向量,中任意,并选择欧氏距离作为数据的距离度量方法根据第一一个向量之间次分类得到的预测结果候选集C,分别计算A和特征集合a中每,的距离:—'=U'==-〇Cl2...0(411i(jj,,、,,)/j)(心)最后,取A的最小值所对应的乍为该图像A的最终预测结果;完成对测试集图像5的分类。32 式汉科技大学硕去学位论文综上所述,本文算法整体表述如表4.1所示。表4.1本文算法流程输入:未标记的图像训练集样本乂、有标记的训练集样本Q和未标记测试集样本5;输出:测试集样本5的图像所属标签类别五.。,1.将从原始图像样本的未标记训练集乂中选取图像局部区域作为基于线性解码器神经网络-的输入,)W。同时,设置隐含层神经元的个数根据公式(328计算该网络中的权值向量和偏置向量6;2.利用计算得到的权值向量VV和偏置向量6,对训练集样本Q和测试集样本S进行卷积,得到特征矩阵化。?,?w和化胃;同时提取训练集样本n和测试集样本S的颜色、纹。""。?理特征,分别构成矩阵^6[:和公£1:。3.设置池化操作的池化区域大小为,对训练集样本Q和测试集样本S中图像不同位置的特征进行聚合统计,即:对特征矩阵化,。。和化胃进行池化操作得到特征矩方和公阵,4--.4)计算出式(45)将特征炬阵化wwj.作为Softmax回归模型的训练样本。根据公式(8,。,一-06?1中的参数..0,8〇611^,计算出式(4〇)..得到训练好的回归模型中每个样本&,,,,:;4所属的类别候选集C=c...,,,;,K,,q,。},x""""p5.根据从训练集样本a和测试集样本S中提取图像的视觉特征^e:和Se:,计算特=...a征矩阵^中每个类别在每个维度上的特征平均值,构成表达式集合aa,,,结合h,j'4=-步驟中得到的类别候选集<:<:...<:,根据公式(411)计算集合样本间的欧氏,,,,。},把,,距离,并取距离最小值对应的类别作为最终预测分类结果并记为4。4.3本章小结神经网络中的分类往往只采用通过网络学习得到的特征来进行分类器的训,LA练忽略了来自图像本身人工可:提取的特征对分类结果的辅助影响。本章在Softmax回归模型的基础上,提出改进的分类方式,将从神经网络学习到的特征矩阵作为Softmax回归模型的输入对模型进行训练;同时,计算人工提取的图像视觉特征的平均特征矩阵;利用训练好的模型对测试集进行首次分类,将得到的首次分类结果与平均特征矩阵相结合,详细阐述了计算得出最终分类结果的过程。33 式汉科技大学硕去学位论文;第5章系统构建和实验结果分析为了测试、验证本文算法在图像分类中的有效性,通过多个对比实验进行了分析说明。本实验是在WINDOWS7系统下,配置Inter2.8GHz的CPUii>及4Gt内存,MATLABR2010b的环境下运行本文算法并对图像进行分类结果分析。5.1系统的整体框架和流程在对图像分类的研究背景W及研究现状进行分析后一,本文提出了个基于线性解码神经网络和Softmax回归预测的二次图像分类算法。wmmPatcheslii:^J■圏0關眺AJi別單^il画画函B壓国B拉kKV關麗.,M函動拒a覇嘘;1難伽Ii窗iilf慶,讓—亡£文義擁芒Lr/'aer/./?巧e,Ly,Layer‘…——…r卷积iIn视觉特征t*4^暴Convolvedfeatu巧;||n|酷离度蓋]分|"‘-…。一-抵3=:rI\;r:::rzzr::;:zzrf_Jr^袭*1^/\.!堯池化CIZZI-j梁Ij^"/_J:7:2公1—'1,iImax?sof巧!Poolededfeaturet巧揀渊:;,;皆二;;二三吉;三;品;;品;二———――———■JILJ图5.1系统流程图首先根据人工提取特征的局限性W及图像的底层特征无法充分地反映其原始图像的高层语义的问题,采用深度学习的方法来对图像特征进行学习,提出基于34 式汉科技大学硕去学位论文。线性解码神经网络然后,为了将图像的特征充分反映及描述,在神经网络学习到的特征的基础上,同步提取图像的颜色特征和纹理特征。随后,根据从数据集中提取的训练集对该神经网络进行训练,用得到的参数对有标记训练集和未标记、测试集进行卷积池化操作,得到该集合的特征矩阵。然后,采用有标记训练集的特征矩阵对Softmax回归模型进行训练。最后,根据人工提取的图像视觉特征,采用距离度量方法与回归模型预测分类候选集相结合,得到最终的图像分类结果。51整个系统的流程图如图.所示。5.2图像数据集为了对本文算法的性能进巧验证,实验从Corel图像数据集中抽取了10个语义类别的图像作为数据集:,包括公交车、轮船、小狗、大象等,其中每个类别,训练集为样本总数的70%30%。包含100幅图像,未标记测试集为样本总数的图5.2显示了10个语义的样本数据的示例。關細晒醒Pif關圍圓圓国圍扁瞧趁术帝V画圍關關画固細圓圆圍y圓Iwill圓I觀爛緊il!圆顧賴图图5.2图像数据集示例35 式汉科技大学硕去学位论文5.3分类结果与对比分析5.3.1性能评价碌准为了对本文算法性能进行评估,采用查准率(Precision)W及查全率(Recall)作为图像分类的评价指标,同时与其他图像分类方法结果进行对比分析。它们的计算方法如下:.A=precison+公-1/(5)reca二llA+C其中,^表示在分类结果中某个类别被正确分类的图像数量,公表示在分类结果中被错误分到该类别的图像数量,C表示在分类结果中应该属于该类别而并没有被分类到该类别的图像数目。这两种性能评价标准都是对图像分类结果的好坏进行评估。查准率越高表示分类的准确率越高,对图像的分类能力越强,;反之查准率越低,表示该算法对图像的分类能力较差,分类的精度小。5.3.2分类结果对比分析为了固定基于线性解码神经网络的输入神经元数量,将选取的数据集中图像一x的尺寸进行归化,将大小设置为96%。同时,因为采用部分联通网络的形式对数据集进行训练,因此从每幅图像中随机选择100幅尺寸大小为8x8的局部小图像。然后,从所有选取出来的小图像中再抽取100000个样本作为基于线性解码神经网络的输入,。而且,由于选择的数据集为彩色图像需要将H个通道的颜色192值全部作为网络的输入,那么可W计算得到该网络的输入层神经元个数为个,根据该神经网络结构特点,需要将该网络输出层的神经元个数也设置为192个,92-400-192且设置隐含层的神经元个数为400个,则该神经网络的结构为1。通过-网络对输入数据的学习,29,得到学习后的400个特征根据公式(3)得到如图5。.3所示的特征可视化图像图中每个小块图像表示所对应的隐含层学习到的特征,可观察到,值的可视化表示,很多小块都是类似图像的边缘部分这有利于进行边缘检测来识别图像。36 式汉科技大学硕去学位论文KK麵騒戲巧喔II壓91賴巧巧巧留疆液窗慶圓逛1續画巧爲6暖函涵震》画团族慶巧陵叛醫Bli麵媛函闘Mil匯Hg塚應巧孩麵匪證導巧芭KSf窗狂陵{■函獲深阁II画涵麽国巧麽慶g核因壓思西巧麵盛S羅紹巧酱逗圾顏巧函函M画UB沒沒留湯餐强巧画顧m媛函醒g涅麽远匪獲岛顏&図医II巧苗a翻极n且■摄函留Mi巧足g證度稼溶这麵療且〇因巧??@?@持V留K沒顔S巧21猪应函曲强資S懲後艇UK族H函画證授懸》百巧壓汲S留巧麵画a沒沒齒筋的遂K函遂巧淺且慶反0较B扉■沒慶絕盈H磁SB齿麵巧@巧^?画淀B巧厳货S翔抵》魔麽田底巧巧》巧巧■!£谢涅函留餐留猛焰狂没画绍遂坦R条函B齿限W謂g沒麽芭路沿巧醒画圆函器B醒S8P没团0醒麵§1?姥緩£&画酱翻3巧;麵函接扭81^田S因盈S该辰K窗巧■?眶S鷹函画Ban暖度涅强荡廣虐度陳麵謹纏図反度Kt巧宙段況顧沒忍後歲巧9遂麵n阵醒爱典a巧&巧KB跑》巧層燈ii资I!巧錫该没顯孩沒EWtiii5图.3基于线性解码神经网络的特征可视化图上文中得到了对第?<个样本预测类别,同时其预测类别概率值排在第y位的类一别编号Q二-。在使用次分类方法前,需要设置个参数《并根据公式(49)来一对图像样本的预测类别做第次分类?,将它们的类别预测结果由A个类别减少到一=^,且该W个类别构成.(:.(:(0个类别个预测结果候选集...::。候选集马,,,。[;1;2,;[二一的构成对图像次分类有较大影响,定程度上决定了能否达到预期的分类结果。本文对参数W设置了不同的值在数据集上进行测试,并假设当图像的标记信息类别属于该图像的预测结果候选集时一,则对该图像的第次分类结果是正确的。基于这个定义,图5.4列出了各个参数所对应的预测结果候选集的覆盖率。"1YIIII1。-?江-9挣。说--I没/獲/。8/-.-日.巧〇.?234567邑9参数值图5.4不同W值的分类结果37 式汉科技大学硕去学位论文 ̄ ̄ ̄对比不同参数值可W发现,当参数越大,预测候选集中包含正确预测类别编号的可能性越大,而同时,包含的错误预测类别编号越多。当参数越小时,预测候选集中包含正确预测类别编号的可能性越小,包含的错误预测类别也越少。候选集越大,分类时需要计算的样本间的相关距离值越多,因此为了减少后续图像《=。5分类的计算时间复杂度,本文将参数?设为5当参数大于时,每个图像样本的预测结果候选集中包含了大多数图像所属的类别编号,同时包含的错误预测类别也较少。在得到预测结果候选集后,需要结合候选集来计算样本间的距离,并最终确定图像的分类结果。在图像样本的距离度量中,存在很多度量方式,如欧氏距离(EucIideanDistance)度量、夹角余弦(Cosine)度量。圍5.5列出了加入度量算法与不加入度量算法在图像各类中的分类查准率。’1jiI!t!iI1II0--.3巴二巧吉巧爱-画I。-,rII--n.目?;iiIp—-ii;So.sniM:'*?'《I■!ir!<-巧一〇.';:;参iIgII-i0,3i6P:0-—.2jI|1|,||I-—"1It11j1I1l■H■—Bi■_^—Wi——HLAB.JS函—■.隱_■整祖—'stsart如幻的h航snpiwsesmobusfiowsrneccoig图5.5图像各类别查准率对图像各类别的查准率实验结果图分析可知,在得到基于线性解码神经网络学习到的特征与人工提取的颜色特征W及纹理特征的前提下,通过采用欧氏距离度量方法与预测候选集相结合得到的查准率大多数高于其他两种度量方式。虽然在类别car与类别bus的查准率要低于直接通过Softmax回归模型分类或者加入余弦距离的度量方式,但是在数值上的误差并不大。同时,在类别nests、elephant、纯ip和flower中,查准率有显著提高。可见,在本文算法的图像语义分类部分选择欧氏距离作为相关性度量方法在查准率方面优于不加入距离度量直接分类的方式和加入余弦距离度量的算法。同理,可W对图像各类别分类结果在H种不同度量方式下的查全率进行对比.6,图像各类别查全率结果如图5所示。38 或汉科技大学硕去学位论文'1II厂IIiIII11一II-0—.9圓区二3辛巧巧*巧?^■的S巧否度gI^InII;I,;:1關1011關關II幻cti?lhl化hinbon*tcaroer??norwdou*Itwwggp巧图5.6图像各类别査全率对图像各类别的查全率实验结果图分析可知,采用欧氏距离度量方法与预测一候选集相结合得到的查全率定程度都高于其他两种度量方式。虽然在类别dog、bus与类别horse的查准率要低于直接通过Softm化回归模型分类或者余弦距离的cart度量方式,但是在类别、iger、dino和flower中,查全率有显著提高。可见,在本文算法的图像语义分类部分选择欧氏距离作为相关性度量方法在查全率方面优于这两种方式。一在通过对比实验确定本文算法的参数与度量方法后,为了进步分析本文算法的有效性,文中比较了使用隐藏神经元个数相同的传统BP神经网络、基于线NN-K,kNearestNe性解码神经网络、最近邻(kighbor分类算法W及W直方图作为)图像特征并使用SVM分类的算法的平均分类准确率如表5.1所示。■表5.1不同算法的图像分类平均准确率平均准确率BP神经网络52.0%基于线性解码神经网络63.0%-NN43Keareste.最近缔(kNN,kighbor8%)SVM52.5%本文算法71.7%51,BP从表.中分析可知当隐含层神经元个数相同时,传统神经网络算法得39 式汉科技大学硕壬学位论文到的图像分类平均准确率为52.0%k最近SVM;在传统分类方法中,邻方法与算法对图像的分类准确率都不超过60%;而基于线性解码神经网络的分类准确率为树.0%;本文算法在基于线性解码神经网络的基础上,加入图像的颜色特征与纹理特征,两类持征同时作用于Softmax回归模型而得到的图像分类准确率为71.7%。可见文本算法性能高于传统算法,有效提高了该图像分类算法的准确率。5.4本章小结本章首先详细阐述了整个算法系统框架和具体流程;然后针对实验数据集做了相应介绍和展示。在实验分析部分,分析设置不同大小参数值对图像首次分类结果的影响。测试了基于线性解码神经网络学习的特征W及人工提取的颜色特征和纹理特征对图像分类的结果差异。,W及不同的样本相关性度量方法对分类的结果影响通过对比实验,验证了本文算法能够有效地提高图像分类的查准率和查全率,有效验证了基于线性解码神经网络和回归分析预测的图像分类算法的有效性。40 式汉科技大学硕壬学位论文第6章总结与展望6.1总结本文首先详细阐述了关于图像分类的研究意义W及该方向在国内外的研究现状。在研究现状方面,着重介绍了在图像分类方面,基于神经网络和深度学习的一研究进展。随后,通过对图像分类流程的介绍,总结了般图像分类的大致流程和每个步骤的主要工作。之后,通过对传统神经网络的简单介绍引出了基于深度学习的深度神经网络方法的介绍,,对比了两种神经网络的相似和不同点并详细阐述了它的网络训练过程。同时,总结性介绍了几种常用的相关性度量方法。然"",后,针对图像分类中存在的语义鸿沟和人工提取特征的制约性问题提出了基于线性解码神经网络和Softmax回归模型分类的图像分类算法。通过实验测试了设置不同参数对实验分类结果的影响,W及不同度量方式对图像查准率和查全率的影响。最后,,在标准图像数据集的基础上通过实验与传,证明了本文工作的有效性统图像分类方法做了对比分析。本文的主要工作如下:1)针对图像分类中通常使用人工设定的计算方法得到的视觉特征存在的缺。陷,提出了基于线性解码神经网络提取图像特征的方法通过神经网络提取的图、像特征都是对数据的学习而得到了,避免了人工提取特征无法全面准确描述图像信息的缺陪。2)改进了Softmax回归模型,训练得到回归模型的各个参数后,通过计算得到的数据集各个图像的类别预测概率,利用参数计算得到图像样本的类别预测候选集,完成对图像的首次分类。3)为了使特征矩阵对图像信息的表达更完备,提取图像的颜色和纹理特征,利用人工提取的特征与神经网络学习得到的特征相结合,在预测候选集的范围内,计算样本间的相关性大小得到最终的分类结果,。通过对比试验证明本文算法对图像的分类效果有较大提高。6.2展望随着如今互联网的高速直线发展,图像数据呈现出爆炸式的増长,需要进行分类处理的图像日益剧增,。依靠人工来对它们进行分类显然是费时费力的但是依靠图像分类算法对图像进行分类需要克服图像数据的底层特征与其高层语义之""l间难iA越过的语义鸿沟问题。同时,如何提高图像分类查准率和查全率仍然具41 式汉科技大学硕去学位论文有挑战性。针对上述问题并W当前研巧结果为依据,本文需要从下面两个方面进行更深入的探索;1基于大数据图像的分类)通过本文对比实验可W看到,特征提取方法和相似性度量方法不同对其分类的查准率和查全率影响较大。针对目前出现的大数据问题,如何对海量数据有效而快速地进行神经网络的训练而得到特征,W及如何对数W亿计的图像进行相似一性度量是需要进步研究的问题。2基于复杂语义图像数据的分类)现有的数据集一一般都是对应着个语义类别,然而在目前图像数据中,具有多重语义的图像数据也占据了一定比例一。例如,幅在沙滩边观看落日的图像,""""""一它的语义类别可W是沙滩,也可W是大海或者太阳。采用单的语义划分图像显然不能满足要求,在W后的研究中,如何针对图像日趋丰富的语义特点对图像进行多语义标注和分类是未来值得研巧的方向。42 式汉科技大学硕壬学位论文致谢时光飞逝,我在武汉科技大学学习生活的日子即将结束,H年的硕±生活让我受益良多。首先,我要感谢我的导师张鸿教授。在生活中,张老师对我关怀备至,在我遇到困难时给予我无私的帮助。在学习中,张老师渊博的知识和严谨的科研态度使我在科研工作中得到了很大的感染和进步。本论文从选题、开题报告、研究方案、研巧过程到论文的书写、修改和定稿都倾注着张老师的也血,在此对张老师表示诚擎的感谢和崇髙的敬意。其次,我要感谢实验室里所有的同学们对我在学术研究上给予的无私帮助和一支持,使我获得了更丰富、全面的知识;更要感谢同学们直[^来对我的包容和关也。然后,我要感谢我的家人和朋友们,没有他们做我坚强的后盾,我不会有今天成绩、鼓励和关爱。,感谢他们多年来对我无条件的支持、!最后,祝愿武汉科技大学人才辈出永铸辉煌43 式汉科技大学硕去学位论文参考文献沈图.浙江大学20.U]朱蓉.基于语义的W像分类研究[D],11口]HuangT,RuiY,ChangSEImageretrieval:Past,present,andfiiture[C]//IntemationalSymposiumonMultimedi泣InformationFroc的sing.1997,108.3NiblackCWBarberREuitzWetal.BICroect:uerinimaesbcontent[],,q,Qpjqyggy,'usingcolortextureandshaeC//IS&T/SPIEsSymosiumo打Electronic,,p[]pImain:ScienceandTechnolo.InternationalSocietforOticsandPhotonicsgggyyp,1993-:173187.maw-4MosilovicARoowitzB.Caturiniesemanticsi化lowlevel[]j,gpggdescritorsC//ImaeProcessin2001.Proceedins.2001Internationalp[]gg,gerence-Confon.圧EE20011:1821.,,D-5Mew.SebeC.erabaandR.Jain.Contentbasedmultimediainformation.LN[],,j^retrievatt--t-tMTitl:saeofhearandchallenges.ACransacton,onMulimediaaons-ComutinCommunicationand:Alicti.VoL2No.l2006119.,pg,pp,[6]JiangL,YuSI,MengD,etal.Bridgingtheultimatesemanticgap:AsemanticsearchenineforinternetvideosC//Proceedinsofthe5thACMonInternationalg[]gConference2015-onMultimediaRetrieval.ACM:2734.,7FuYLinZ.Sacetravelinacrossvm;Automaticallbridi打thesemantica[],pgygggpinvirtualmachineintrospectionviaonlinekerneldataredirectionC//Securitand[]yPrivacySP20-12距EESmposiumon.IEEE2012:586600.(),y,[8]MichieD,SpiegelhalterDJ,TaylorCC.Machinelearning,打euralandstatistical-classification口.1994:38157.]-uaeormaeandveoumachne9NarwariaMLinW.SVDbasedlitmtricfiidsini[],qyggleaming[J].Systems,Man,andCybernetics,PartB:Cybernetics,IEEEransactons-Tion2012422:347364.,,()1euort-vksachinelearnin0CortsCnikV:Va.Sector凸etwor.M1995203阴,()|^],pppg,-297273.MoraesRVa-tt[lUliatiJFNetoWPG0?Documentlevelsentimenclassificaion:An,,emiricalcomarisonbetweenSVMandANN?ExertSstemswi化Alications,pp口]pypp203402-1:621633().,44 式汉科技大学硕去学位论文[12]SubasiA.ClassificationofEMGsignalsusin呂PSOoptimizedSVMfordiagnosisofneuromusculardisorders口].Computersi打biologyandmedicine,2013,43口):-5%576.Nezamabad-[13]SarafraziS,ipourH.FacingtheclassificationofbinarroblemswithaypGSA-SVMhbrlidsyst:emJ.MathematicalandCompWerModelin,2013,571:y[]g()270-278.14沈掌泉胜.何灵敏.SVM在J中[],孔繁,等多源遥感图像分类中的应用研究[,]074-国图象图形学报,20,12(4):68654.15蒋芸李战怀.基于改进的SVM分类器的医学图像分类新方法倡计算机[],[町应用研究2008251.,,()16FreundYSchaire民ESchaire艮:Exerimentswitha打ewboostin[],p.ppgalgorithinC//I打:ThirteenthInl:emationalCo打ferenceonML.1996.[][17]HausslerD.Probablyapproximatelycorrectleaming[M].UniversityofCalifornia,SantaCruzComuterResearchLaborator1990.,,py18FreundYSchapireRE.Exerime打tswithanewboostinalorithmC//ICML.[],p呂g[]-199696;148156.,[19]Rume化artDE,HintonGE,Williams民J.Learninginl:emalrepresentationsbyerrorroaation民.CALIFO民NIAUNIVSAND祀GOLAJOLLAINSTFORppg[]COGN打IVESCIENCE1985.,[20]Cigi之ogluH1C,Ki§iO.Flowpredictio打bythreebackpropagationtech打iquesusingk-fbidartitioningofneuralnetworkIrainingdataJ.Hdrolo民esearch2005p[]ygy,,49-361.:64()lHinU)nGESalakhutdinov民民.民educin化edimensionalitofdatawkhneural口],gy-networksJ.Science20063.135786;504507,,)[](22DLYuD.DeelearninMehodiJ.Fien:tsa打dalicatonsoundato打sand下rends[]g,pgpp[]--i20144738inSnalProcessin7:19.gg,,口)7[23]DonG,LoGG,He1C,etal.Learninadeeconvolutional打etworkforimaegygpg-Vi—InsuerresolutionM//ComutersECCV2014.Si1tpionrner;emaional[]ppgPub-lishing2014:184199.,[24]Salakhutdinov艮,Mn化A,Hin1:onG.民estridedBoltzmannmachinesforcollaborative巧lteringC//Proceedinsofthe24thin化mationalconferenceon[]gMA1-798achine.learnin.CM2007:79g,25Vncenarocheeata.taucoderarnitPLllHLoieIelSackedde打oisi打toens:Lein[],,,jgg45 式汉科技大学硕去学位论文rtldusefulreresentationsinadeenetwokwihalocaenoisincriterionJ,Theppg[]urna-JolofMachineLearninResearch201011:33713408.g,,[26]Salakhutdinov民,HintonGE.Deepboltzmannmachines[C]^Intemationalfer-conenceonartificialintellige打ceand巧atistics.2009:448455.[27]KrizhevskyA,SutskeverI,HintonGE.ImagenetclassificationwithdeepconvolutionalneuralnetworksC//Advancesinneuralinformationroce巧in[]pgssm-ytes.2012:10971105.28^[]PoultneCChoiraSCunYL.Eficie打tleami打ofsarsereiese打tationswi化any,p,gppener-bsedgyamodel[C]//Advancesinneuralinformationrocessinsystems.2006:pg1-1371144.29LeeHGro巧e民Rananath民etal.Co打volutionaldeebelief打etworksfor[],,g,pscalableunsupervi巧dlearninofhierarchicalrepresentationsC//Proceedinsofg[]gthe26thAnnualInternationalConferenceonMachineLearning.ACM2009:,609-616.30王勇赵检辉登义等?基于稀疏自编码深度神经网络的林火图像分类阴.计[],,章-201424.算机工程与应用:173177,()3-技aturesusinresca1LeQV.Buildinhilevellaleunsuervised[]gghggpleaming//AcousticsSee地andSinalProcessinICA%P2013圧EE[C],pgg(),ernan-InttionalConferenceo.IEEE2013:85958598.,[32]DeanCorradoGMongaR,etal.Largescaledistributeddeep打etworks[C]//AdvancesinNeuralInformationProc的singSys化ms.2012:22-131231.[33]KrizlievskyA,SutskeverI,Hi打to打GE.Imagenetclassificationwithdeepconvolutionalneuralnetworks[C//Advancesin打euralinformationrocessin]pgs-system.2012:10971105.口4SzeedyCLiuWJi汪Yetal.GoindeeerwithconvolutionsC//Proceedinsof]g,,,gp[]gterencemt-heIEEEConfonCouerVisionandPatternRecognition.2015:19.p[3引McCullochW8,PitsW.Alogicalcalculusoftihieideasimma打entinnervousn-activitJ,Thebulletiofmathematicalbiohysics194354:115133.y[]p,,()36RosenblattRPrincilesofneiirodnamics.ercetronsandthetheorofbrain[]pyppymechanismsR.CORNELLAERONAUTICALLABINCBUFFALONY1961.[],37SheherdGM.FoxmdationsoftheneurondoctrineM.NewYork:Oxford[]p[]Universityress1991.P,46 或汉科技大学硕去学位论文[38杨国军,崔平远,李靖琳.遗传算法在神经网络控制中的应用与实现系统仿][叮200-真学报1135:567570.,,()[39]DonahueJ,JiaY,Vinyals0,etal.Decaf:AdeepCO打volutionalactivationfeatureforenericvisualreco打itio打J3101..arXivreri打tar又iv:1.5312013g,g[]pp[40]DengL,YuD.Deepleami打g:Methodsa打过applicatio打s[J].Foundatio打sa打dTre打dsnaPross-4-inSilcein20147:197387.g,g,口)Me-41CiresanD,ierUSchmidhuberJ.Multicolumndeeneuralnetworksforimae[],pgclassificationC//ComuterVisio打andPattern氏econitio打CVP民2012EEEE[]pg(),Conference20-3649on.圧EE12:3642.,42DZhZME-e打Ja打archietal.Sarseautoe打coderbasedfeaturetra打sferlearnin[],,,ggpgforspeechemotionrecognitio打[C]//AfectiveComputingandIntellige打tInfractionAC-II2013umaneAssociatio打onferenceonEEE2013:5111,HiC.I56.(),一43杨涛张森林,.种基于HSV颜色空间和S圧T特征的车牌提取算法J计[],[]-2012810.算机应用研究:3939,1,)3937(44王宇石,高文.用基于视觉单词上下文的核函数对图像分类[J,中国图象图形[]]20101547-1学报:6066.,,()47 式汉科技大学硕去学位论文附录1攻读硕±学位期间发表的论义1ZhanHWuP,BeckA,etal.Adativeincrementallearninofimaesemantics[]g,pggu-withalication化socialrobot口].Neurocomtin2016173:93101?pppg,,P]Zhang打,WuP.ImageQassificatio打withLocalLi打earDecodingandGlobal-feature—MultiFusion[M]//AdvancesinMultime出aInformationFrocessingPCMllin-2015;.SpringerInternationaPubshig2015437446.,48 式汉科技大学硕壬学位论文附录2攻读硕±学位期间参加的科研项目U]国家自然科学基金青年项目(No.61003127).间国家自然科学基金面上项目(No.61373109).49

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭