欢迎来到天天文库
浏览记录
ID:37045425
大小:3.01 MB
页数:63页
时间:2019-05-17
《细粒度图像分类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文细粒度图像分类算法研究RESEARCHONTHEALGORITHMFORFINE-GRAINEDIMAGECLASSIFICATION张阳哈尔滨工业大学2017年12月国内图书分类号:TP391.4学校代码:10213国际图书分类号:004.93密级:公开工学硕士学位论文细粒度图像分类算法研究硕士研究生:张阳导师:王鸿鹏教授申请学位:工学硕士学科:计算机科学与技术所在单位:深圳研究生院答辩日期:2017年12月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.4U.D.C:004.93Adissertationsubmitted
2、inpartialfulfillmentoftherequirementsfortheacademicdegreeofMasterofEngineeringRESEARCHONTHEALGORITHMFORFINE-GRAINEDIMAGECLASSIFICATIONCandidate:ZhangYangSupervisor:Prof.WangHongpengAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyAffiliation:ShenzhenG
3、raduateSchoolDateofDefence:December,2017Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学硕士学位论文摘要细粒度图像分类是图像分类的子任务,主要区分同一类别下的不同子类,如鸟的品种,车的型号等,对于海量图像数据的检索和分类管理有着重大的意义。与一般的分类任务不同,细粒度图像分类具有类内差距小的特点,往往需要借助微小的局部细节差异才能分辨出不同的类别。因此,目前的细粒度图像分类算法首先使用分组合并策略生成候选区域,再利用包围框标注和空间约束进行筛选
4、,最后根据候选区域训练卷积神经网络进行分类。由于没有充分利用到目标信息,候选区域仍然包含较大冗余信息,影响了分类的性能。对此,本文设计了基于注意力机制的细粒度图像分类算法。注意力机制反映了人类视觉系统对周围环境的感知差异,即注意力会重点集中在环境中的显著性区域上。本文使用卷积神经网络模拟了人类的视觉注意力特性,从而充分利用了分类目标的信息,有助于提高细粒度图像分类的准确率。算法的整体框架包括注意力网络和分类网络两部分,其中重点是注意力网络的设计。针对现有算法生成的候选区域包含冗余信息的问题,本文引入并改进了注意力网络,通过神经网络卷积得到的特征图提取注意力分布图
5、完成图像物体层面和物体局部层面的定位,同时在原网络最后一层卷积层之后加入了双线性运算,增强了网络的特征表现能力,从而优化显著性区域的定位效果,为分类网络提供了良好的基础。为了更好地利用局部特征,本文设计了多尺度分类网络从多个不同层面完成分类。根据注意力网络提取到的注意力分布图,本文利用HSV颜色空间模型进行图像分割,得到物体层面和物体局部层面的显著性区域切片,并分别训练双线性分类网络模型。对于训练好的物体级和局部级分类网络,本文使用多模型融合的策略,将两个网络的softmax向量进行融合,得到最终的分类结果。本文通过大量的实验验证了分类框架的有效性。实验表明,本
6、文算法在Car-196、CUB-200两个公开数据集上分别达到了91.6%、85.6%的准确率,相对基准模型分别提升了1.4%和1.5%。同时在分类样本更加复杂的FishCLEF2017在线评测任务上达到了65%的准确率,相对基准模型提升6%。通过分析实验结果可知,本文算法对于高分辨率和低分类目标占比的图像提升比较明显。关键词:细粒度图像分类;卷积神经网络;注意力网络;双线性运算;多尺度模型融合-I-哈尔滨工业大学硕士学位论文ABSTRACTFine-grainedimageclassificationisthesub-taskofimageclassifica
7、tion,whichmainlyfocusonthedifferentsub-categoriesofthesamecategory,suchasthevarietyofbirds,thetypeofcars,etc.Ithasgreatsignificanceformassiveimagedataretrievalandclassificationmanagement.Differentfromthegeneralclassificationtasks,fine-grainedimageclassificationhasthecharacteristicsof
8、smallintracl
此文档下载收益归作者所有