欢迎来到天天文库
浏览记录
ID:25143722
大小:459.50 KB
页数:8页
时间:2018-11-17
《基于fpga的稠密光流计算系统》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于FPGA的稠密光流计算系统#马骏,柴志雷,王芝斌,钟传杰**(江南大学物联网工程学院轻工过程先进控制重点实验室(教育部),江苏无锡214122)510152025303540摘要:高质量的稠密光流算法计算复杂度很高,因此计算速度成为制约其在实际系统中应用的重要原因。针对这一问题,利用现场可编程门阵列(FPGA)的细粒度并行特性,实现了一种高质量的稠密光流算法CBG(Combined-Brightness-Gradient)的硬件加速器。实验结果表明,在FPGA工作频率200MHz、计算全部像素对应的光流信息的情况下,该系统
2、处理分辨率为316×252的图像序列的帧频可达40fps。关键词:流计算;超松弛法;可编程逻辑门阵列;并行计算;实时性中图分类号:TP391FPGA-baseddenseopticalflowcomputingsystemMAJun,CHAIZhilei,WANGZhibin,ZHONGChuangjie(CollegeofInternetofThings,JiangnanUniversity,KeyLaboratoryofAdvancedProcessControlforLightIndustry(MinistryofEduca
3、tion),WuxiJiangsu214122,China)Abstract:High-qualityalgorithmsfordenseopticalflowcomputationarecomputationallyexpensive,whichlimitstheirusabilityinreal-worldapplications.Inordertosolvethisproblem,thehardwareacceleratorisappliedforahigh-qualitydenseopticalflowalgorithmb
4、yCBG(Combined-Brightness-Gradient)model,basedonfine-grainedparallelismsofFPGAs(FieldProgrammableGateArrays).Experimentalresultsshowthat40fpscanbeprocessedintimewhentheworkingfrequencyis200MHzandtheimagesizeis316×252.Furthermore,opticalflowfieldsforallpixelsinsteadofse
5、lectedareasarecomputedfordesigning.Keywords:opticalflowcomputation;successiveoverrelaxationmethod;FPGA;parallelcomputing;real-timeperformance0引言光流法广泛使用在运动目标检测、跟踪和行为分析等视频/图像处理领域。自Horn和Schunck提出基本的稠密光流计算(HS)模型[1]以来,可计算稠密光流的计算模型得到不断的发展与完善。然而高质量的光流算法意味着较高的运算复杂度和较差的实时性,例如在
6、主频为3.06GHz的IntelPentium4处理器上处理316×252的图片序列时,每帧需要时间1.2s[2],显然无法满足大多数实际应用的实时性需求。为提升光流法的计算速度,许多研究着眼于简化运算复杂度或采用GPU加速。如文献[3]中通过加入多重网格算法降低CPU上的运算复杂度,文献[4]中采用了GPU并行计算。尽管在一定程度上提升了计算性能,但前者牺牲了运算精度且实时性表现依然不理想;而后者则有较高的功耗,限制了其在低功耗场景中的应用。现场可编程门阵列(FieldProgrammableGateArrays,FPGA)支持
7、细粒度并行计算,能以较低的运行频率与功耗实现高的处理性能,有助于进一步提升处理速度并满足功耗需求。已有一些基于FPGA的光流算法加速方面的研究如文献[5][6],但目前多数都只实现了基本的HS光流模型。更高质量的光流算法的FPGA加速方面的工作尚未见报到。此外,上述研究基金项目:国家自然科学基金(61170121,61202312);高等学校学科创新引智计划(No.B12018)作者简介:马骏(1987-),男,硕士研究生,主要研究领域为专用集成电路和系统设计通信联系人:钟传杰(1959-),男,教授,主要研究领域为半导体器件与专
8、用集成电路设计.E-mail:zhongchuanjie@jiangnan.edu.cn-1-还存在关键参数未给出以及只计算图像选定的局部区域的光流场等问题。因此,本文基于FPGA结构特点,充分挖掘光流算法的不同并行性,实现了一种高质量的稠密光流
此文档下载收益归作者所有