基于眼动注视点和多尺度卷积神经网络的显著目标检测

基于眼动注视点和多尺度卷积神经网络的显著目标检测

ID:34404701

大小:26.49 MB

页数:53页

时间:2019-03-05

基于眼动注视点和多尺度卷积神经网络的显著目标检测_第1页
基于眼动注视点和多尺度卷积神经网络的显著目标检测_第2页
基于眼动注视点和多尺度卷积神经网络的显著目标检测_第3页
基于眼动注视点和多尺度卷积神经网络的显著目标检测_第4页
基于眼动注视点和多尺度卷积神经网络的显著目标检测_第5页
资源描述:

《基于眼动注视点和多尺度卷积神经网络的显著目标检测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、校代码10530学号201510171780分类号TP391密级硕士学位论文基于眼动注视点和多尺度卷积神经网络的显著目标检测学位申请人邓文振指导教师肖芬教授学院名称信息工程学院学科专业信息与通信工程研究方向智能信息处理二○一八年六月五日SalientObjectDetectionBasedonEyeTrackingDataandMulti-scaleConvolutionalNeuralNetworkCandidateWenzhenDengSupervisorProf.FenXiaoCollegeC

2、ollegeofInformationEngineeringProgramInformationandCommunicationEngineeringSpecializationIntelligenceInformationProcessingDegreeMasterofScienceUniversityXiangtanUniversitythDateJune5,2018摘要随着互联网和多媒体技术的快速发展,图像逐渐成为人们传递信息的重要载体。如何有效的从海量地图像数据中过滤冗余信息并提取出图像中的

3、显著区域已经成为图像处理领域的热门问题,图像显著目标检测是解决该问题的一个重要方法。通常,基于底层特征的显著目标检测模型虽然在简单图像中取得了较好的效果,但是没有考虑人眼的视觉特性和高层语义特征,因此无法满足复杂图像的显著目标检测需求。卷积神经网络通过监督学习可以有效的提取图像的高层语义特征,被广泛地应用于图像处理领域。眼动记录了人眼在观察图像时的运动信息,为了解人眼的视觉感知和真实意图提供了依据,利用眼动可以很好地模拟人的视觉选择注意机制。基于以上考虑,本文提出了一种结合眼动注视点和多尺度卷积神经

4、网络的图像显著目标检测模型,充分利用眼动数据提取图像的高层语义信息,有效提高了显著性检测的性能。本文的主要工作有:(1)提出了一种基于多尺度卷积神经网络的显著目标检测模型。首先,使用循环卷积神经网络提取图像的高层语义特征,通过反卷积网络将该特征非线性映射为分层的特征图;然后对特征图提取多尺度的显著先验图;最后通过融合卷积网络得到最终的显著图。(2)提出了融合眼动注视点的图像显著目标检测算法。通过眼动注视点得到眼动显著图,将眼动显著图作为图像的第四个通道来检测图像的显著区域,实验结果表明眼动可以有效地

5、改善模型的显著目标检测性能。关键词:眼动;多尺度;卷积神经网络;显著目标检测IAbstractWiththerapiddevelopmentofInternetandmultimediatechnology,imagehasbecomeanimportantcarrierofinformationtransmission.Ithasbecomeahotissuetoeffectivelyfiltertheredundantinformationandextractthesaliencyregionf

6、romtheamountofimagedata,imagesalientobjectdetectionisanimportantwaytosolvetheproblem.Generally,thelow-levelfeaturesbasedsaliencydetectionmodelhasachievedgoodperformance,however,itwithouttakeintoaccountthehuman’svisualattentionandhigh-levelsemanticfeatu

7、re,whichcan’tsatisfythedemandofcompleximage.Inspiredbythefactthatconvolutionalneuralnetworkhasforcefulabilitytoextracthigh-levelsemanticfeaturesfromrawpixelsautomatically,ithasbeenwidelyutilizedinimageprocessing.Byrecordinghumaneyemovementinformationin

8、watchingimage,eyetrackingdataprovidesabasisforunderstandingthevisualperceptionandrealintentionofthehumaneye,whichcanbeusedtosimulatepeople’svisualselectiveattentionmechanism.Themainworksaresummarizedasfollows:(1)Anovelsalientobjectdetec

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。