基于卷积神经网络与多模板的视觉跟踪算法研究

基于卷积神经网络与多模板的视觉跟踪算法研究

ID:37024091

大小:2.99 MB

页数:62页

时间:2019-05-17

基于卷积神经网络与多模板的视觉跟踪算法研究_第1页
基于卷积神经网络与多模板的视觉跟踪算法研究_第2页
基于卷积神经网络与多模板的视觉跟踪算法研究_第3页
基于卷积神经网络与多模板的视觉跟踪算法研究_第4页
基于卷积神经网络与多模板的视觉跟踪算法研究_第5页
资源描述:

《基于卷积神经网络与多模板的视觉跟踪算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于卷积神经网络与多模板的视觉跟踪算法研究Researchonvisualtrackingbasedonconvolutionalneuralnetworkandmultiplemodels工程领域:仪器仪表工程作者姓名:王鹏翔指导教师:郭敬滨副教授企业导师:山岡啓介天津大学精密仪器与光电子工程学院二零一七年十二月摘要视觉跟踪是机器视觉的主要研究方向之一。目标检测法是视觉跟踪常用方法,其本质上是图像分类任务,相较于多类别分类任务,它只需区分目标和背景这两种类别。所以提高分类器的性能是提高跟踪任务成功率和准确率的关键。近

2、年来随着大数据、云计算、GPU和AI芯片的迅速发展,之前由于计算速度慢、数据量不足而得不到重视的人工神经网络算法被应用于实践。卷积神经网络(ConvolutionalNeuralNetwork,CNN)作为一种神经网络结构,在处理图像时避免了人工设计特征,可直接处理原始图像,使得其卷积层提取的图像特征对跟踪任务有着更强的针对性和适用性。神经网络需要使用大量已标注的数据进行训练,但是在一个跟踪任务中,已标注的训练数据仅有第一帧或仅有一张图片。训练数据的不足会导致模型的过拟合,于是针对训练数据不足的问题本文引入了多域学习法

3、进行网络的预训练。但是传统的CNN在跟踪任务中对于目标的遮挡和非刚性形变容易产生模板漂移的问题,而采用多模板策略可以抑制这种漂移。于是为了适应视觉跟踪过程中目标外观变化,提高视觉跟踪算法的鲁棒性,本文研究了CNN在视觉跟踪领域的应用,并基于CNN结合多域学习法与多模板管理,提出一种通过树形结构管理多模板的多域卷积神经网络(Multi-DomainCNNswithMultipleModelsinatreestructure)视觉跟踪算法。首先使用大量已标记目标位置的视频数据预训练多域结构的CNN,使CNN的卷积层可从图像

4、中提取出适用于跟踪任务的特征。然后在跟踪时中对CNN全连接层进行微调以适应跟踪目标,并使用树形结构管理存储不同时间段的目标模板得到模板树。使用模板树综合评价待检测帧,估计目标位置。最后按照一定规则将新模板添加进模板树,完成模板的更新。实验表明,该算法对跟踪过程中目标外观的变化有着良好的适应性,同时多模板可抑制CNN在跟踪时产生的模板漂移问题。关键词:视觉跟踪;深度学习;卷积神经网络;多域学习;多模板IABSTRACTAsoneoftheelementalproblemsincomputervision,visualtr

5、ackinghasalwaysbeenahottopic.Tracking-by-detectionisacommonandeffectivemethodforvisualtracking.Essentiallyitisaproblemofimagesclassification,butonlytwocategoriesneedtobeclassified—targetsandbackgrounds.Therefore,improvingtheperformanceoftheclassifiersisthekeytoi

6、mprovethesuccessrateandaccuracyofthevisualtrackingtasks.Duetotherapiddevelopmentofbigdata,cloudcomputing,GPUsandAIchipsinrecentyears,neuralnetworkswhichwerenottakenseriouslyduetoitsslowcomputationandthelackofdatapreviouslyareappliedtopractice.Convolutionalneural

7、network(CNN),asakindofneuralnetworkstructure,doesnotrelyontheartificialdesignfeatureswhenprocessingimages,andcandealwiththeoriginalimagesdirectly.Sothatthefeaturesextractedbytheconvolutionlayersfromthepicturesaremoreappropriateforthevisualtracking.Thetrainingoft

8、heCNNsrequiresalargenumberofartificiallylabeleddataforreliableperformance.However,inatrackingtask,theavailabletrainingdataisonlyinthefirstframefromwhichwecangetthepos

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。