双目立体视觉中的图像匹配技术-研究

双目立体视觉中的图像匹配技术-研究

ID:31498160

大小:3.62 MB

页数:104页

时间:2019-01-12

双目立体视觉中的图像匹配技术-研究_第1页
双目立体视觉中的图像匹配技术-研究_第2页
双目立体视觉中的图像匹配技术-研究_第3页
双目立体视觉中的图像匹配技术-研究_第4页
双目立体视觉中的图像匹配技术-研究_第5页
资源描述:

《双目立体视觉中的图像匹配技术-研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、南京航空航天大学硕士学位论文第一章绪论1.1计算机视觉理论视觉是人类观察世界和认知世界的重要手段。据统计,人类从外部世界获得的信息约有80%来自于视觉系统[1][2],这充分体现了人类视觉功能的重要性。人类视觉系统能够通过眼睛成像来感知现实世界中的三维物体,说明人类视觉系统具有从二维景物图像感知三维信息的能力,这对于指导人们生产生活具有重要的意义。随着信息技术的发展,给计算机、机器人或者其它智能机器赋予人类视觉的功能,是人类多年来的梦想,在用计算机实现对视觉信息处理的全过程中形成了一门新兴的学科—计算机视觉。1.1.1计算机视觉的研究目标计算机视觉就是用各种成像系统代替视觉器官作为

2、信息输入手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察来理解世界,具有自主适应环境的能力,这是一个要经过长期努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度智能地完成一定的任务。使用几何模型、复杂的知识表达,采用基于模型的匹配和搜索技术来实现对目标物体的识别,确定目标物体的位置和姿态,对现实世界进行符号描述和解释。归结起来计算机视觉要达到的基本目的:1.根据一幅或多幅二维投影图像计算观察点到目标物体的距离。2.根据一幅或多幅二维投影图像计算目标物体的运动参数

3、。3.根据一幅或多幅二维投影图像计算目标物体的表面物理特性。而要达到的最终目的就是实现对于三维景物世界的理解,即实现人的视觉系统的某些功能。1.1.2Marr计算机视觉理论的发展和框架计算机视觉就是用计算机模拟人眼的视觉功能,从图像或图像序列中1双目立体视觉系统中的图像匹配技术研究提取信息,对客观世界的三维景物和物体进行形态和运动识别和理解。计算机视觉是从上世纪50年代统计模式识别开始的,当时的工作主要集中在二维图像分析、识别和理解上。60年代中期美国MIT的Roberts首先用程序成功地对三维积木世界进行解释,以后Huffman,Clows以及Waltz等人对积木世界进行了研究并

4、分别解决了由线段解释景物和处理阴影的问题[2]。积木世界的研究反映了视觉早期研究中的一些特点,即从简化的世界出发进行研究。这些工作对视觉研究的发展起了促进作用,但对于稍微复杂的景物便难以凑效。1977年,MIT人工智能实验室的Marr教授提出了不同于“积木世界”分析方法的计算机理论——Marr视觉理论。Marr首次从信息处理的角度综合了图像处理、心理物理学、神经生理学以及临床神经病学等方面的研究成果,提出了第一个较为完善的视觉系统框架。Marr认为视觉系统的研究应分为三个层次,即计算理论层次、表达与算法层次和硬件实现层次[1]。计算理论层次要回答视觉系统的计算目的与计算策略是什么,

5、亦即各个部分的输入输出是什么、之间的关系是什么变换或具有什么约束。Marr视觉系统总的输入输出关系规定了一个总的目标,即输入是二维图像,输出是由二维图像重建出来的三维物体的位置和形状。对于表达和算法层次,视觉系统的研究应该给出各个部分的输入、输出和内部的信息表达,以及实现计算理论所规定目标的算法。算法与表达有关,一般来说,不同的表达方式,完成同一计算的算法会不同。但Marr算法与表达是比计算理论低一层次的问题,不同的表达与算法,在计算理论层次上可以是相同的。最后一层是硬件层次,是解决用硬件实现上述表达和算法的问题。目前计算机视觉的研究工作主要是在计算理论层次和表达与算法层次上。Ma

6、rr从视觉计算理论出发,认为视觉过程可分为自上而下的三个阶段,即视觉信息从最初的原始数据到最终对三维环境的表达经历了三个阶段的处理,如图1.1所示。第一阶段(也称为早期阶段)构成所谓的“要素图”或“基元图”,基元图由二维图像中的边缘点、直线段、曲线、顶点、纹理、区域等基本几何元素或特征构成;第二阶段(中期阶段)根据图像中的基本要素恢复可见物体表面的三维信息,得到比线条、区域、二维2南京航空航天大学硕士学位论文形状等更高层次的描述。此阶段存在一些相对独立的处理方法,包括立体视觉,运动视觉,从阴影、纹理恢复形状等等。由于这一阶段仅能从已知数据中恢复物体部分表面,而不能得到包括遮挡部分在

7、内的完整的三维模型,所以Marr称其为2.5维重建,即不完全三维重建;第三阶段,综合第一阶段的要素和第二阶段的2.5维图,建立以物体为中心的三维描述,重建出完整的三维模型。Marr理论是计算机视觉研究领域的划时代成就,积极推动了这一领域的研究,对图像理解和计算机视觉的研究发展起了重要的作用。但Marr理论也有其不足之处:框架的输入是被动的,框架加工目的不变,框架缺乏或者说不足够重视高层知识的指导作用,还有就是整个框架中信息加工过程基本上是自上而下,单向流动[1]。但是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。