欢迎来到天天文库
浏览记录
ID:13034032
大小:7.72 MB
页数:23页
时间:2018-07-20
《8 基于几何光学的单幅二维图像深度估计》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第五章基于几何光学的单幅二维图像深度估计第五章基于几何光学的单幅二维图像深度估计由上一章的内容可知,图像大小恒常性计算的关键在于正确地估计二维图像的深度。二维图像深度估计也是计算视觉中的重点与难点。视觉心理学家通过经验观察和对人的统计实验,总结了人类视觉系统深度感知规律。在上一章的实验表明,应用这些规律建立的单幅二维图像深度模型基本上是有效的,但也存在一些没有很好解决的矛盾,如各种深度线索间的冲突。其次,这些规律是建立在人的主观实验之上的,本质上也需要进一步从物理学的角度进行解释。再次,虽然照相机与人眼在光学成
2、像原理上是基本相同的,但在实现细节上还是存在一些差异。所以本章从几何光学出发,提出了一种基于几何光学的二维图像深度计算方法,并与上一章的基于心理学的深度模型实验结果进行比较,探讨心理学结论应用到计算机视觉问题中的适应性问题。5.1引言尽管学者已从不同的角度对二维图像深度估计问题进行了卓有成效的研究,基于单幅图像(Single-imagebased)的深度计算仍然是一个挑战性问题。现有的各种方法都存在一定的局限性。用阴影求深度方法(Depthfromshading)依赖太多的假定[Forsyth2003,pp80
3、-85][Castelan2004][严涛2000]。在这些假定中,多数假定与客观世界的自然场景不完全一致。用模型求深度的方法(Depthfrommodel)需要物体或场景模型的先验知识[Jelinek2001][Ryoo2004][Wilczkowiak2001]。当物体或场景很难建模,或者模型库变得很大时,这种方法就会失效。用机器学习求深度的方法(Depthfromlearning)要对大量的范例进行训练[Torralba2002][Battiato2004][Nagai2002],而且它们的泛化能力是很弱
4、的。用主动视觉求深度方法(Depthfromactivevision)如编码结构光(Codedstructuredlight)、激光条纹(Laserstripescanning)扫描等需要昂贵的辅助光源设备来产生显著的对应点(对应元素)[Forsyth2003,pp467-491][Wong2005][Nehab2005]。它轻易解决了图像体视匹配(Imagestereomatching)难题,代价是丢失了物体或场景的其它的重要表面属性,如强度、颜色、纹理等。各种方法的比较见本章表5-4。87第五章基于几何光学
5、的单幅二维图像深度估计然而,人类视觉系统能轻易地、完美地感知单幅图像深度,即使只用一只眼睛看图片时也是如此。而且,人类视觉系统在完成这项任务时,好像毫不费力,也不需要意识努力,基本上是自动的加工过程。故可以断言,人类视觉系统使用了某种固定的、简单的图像深度感知规则,并避免了复杂的计算。以此类推,计算机自动估计单幅图像深度也应该是非常简单,非常准确的,其计算量也应该是非常小的。基于这些考虑,我们先从分析人类视觉的成像特点及观察习惯开始。5.2感知深度及模型在本章上述介绍的方法中,图像点的深度被定义为该图像点对应的
6、场景点到相机光心(Pinhole)的距离。实际上,这种对图像点深度的定义与人的感知习惯是不一致的。根据视觉心理学理论与人们的日常体会,人类视觉基本上在无意识水平上运用三个规则来估计自我(Ego)与场景物体间的距离。首先,人眼位于头上,而头又在身体上,身体由四肢支撑,四肢站在地面上[Gibson1979,pp111,205]。这意味着,人眼在观察时离地面有一定的高度。类似的,人们在照相时,相机光心(Pinhole)离地面也有一定的高度。即使趴在地上照相,也是如此,因为相机本身具有一定的高度。在本章的研究中,我们特
7、别强调相机光心离地面的高度,这是第一条规则。其次,人类视觉把人脚到物体脚之间的距离感知为物体的深度(脚到脚,foot-to-foot),而不是人身体的其它部分到物体的其它部分的距离。这是因为支持物体的地面是人类视觉深度感知最重要的参考面[Gibson1979,pp156-164]。例如,图5-1中的场景点P’,Q’有相同的深度,因为两点在同一竖线上,它们有相同的脚。最后,如果在平坦地面上的直线与视网膜平面(即像平面,Imagingplane)平行,那么在这条直线上所有的点将会被感知有相同的深度。这是因为当估计物
8、体的距离时,人类视觉系统通常会调整或想象调整头或身体以保持眼睛正对着物体(面对面,Face-to-face)[Gibson1979,pp111-126]。例如,图5-1中直线L1与像平面Ⅱ平行,所以在L1上的点都与点P’有相同的深度。这样,整个图像深度的估计便归结为垂直中轴线上各点的深度估计。根据这些说明,我们把图像点的深度定义为遵守上述三条规则的、图像点对应场景点到相机光心的距离,而
此文档下载收益归作者所有