欢迎来到天天文库
浏览记录
ID:31584378
大小:4.64 MB
页数:120页
时间:2019-01-14
《基于几何不变量的视觉计算》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、攻读硕士学位期间已发表的论文上海交通大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:刘博文日期:2008年1月21日第81页攻读硕士学位期间已发表的论文上海交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许
2、论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年解密后适用本授权书。本学位论文属于不保密□√。(请在以上方框内打“√”)学位论文作者签名:刘博文指导教师签名:余松煜日期:2008年1月21日日期:2008年1月21日第82页第一章绪论第一章绪论1.1引言随着计算机智能化的发展越来越迅速,计算机也开始像人一样有了可以观察的眼睛,它们将摄像机捕捉到的画面读入到内存中,然后对画面进行各种各样的处理,比如图像中的特定目标检测,特定目标识别和特定目标跟踪等等,这就形
3、成了这些年来最热门的研究领域之一——计算机视觉。人们研究出各种各样仿照生物习惯的机器及其在这些机器上所产生的应用,是为了能给人类的生活和工作带来最深远的影响。而计算机视觉这个仿照人眼而产生的研究领域,其研究的终极目标就是为了能加快处理所有摄取的场景的速度,比如可以迅速找出海量视频序列中我们指定的某些序列,或者可以在机场海关等地方快速搜索每一个到过往旅客的资料,这些都是人眼无法实时处理的。但另一方面,计算机视觉研究也要能如实反映人眼处理的准确性,并能符合人眼的处理特性,最终达到完全替代人眼的目的。可是这条道路是非常曲折的,可以说计算机视觉发展得越快,它要遇到的困难就越大
4、,所要解决的问题也会变得越来越多。人类是智能生物,可以在很短的时间内识别出各种各样的物体,目标和场景,而且这个过程对于我们来说是十分轻松的,不需要刻意的集中精神或者努力思考,同样地,我们也能轻易地识别出照片或者图画中的内容,这是人类智能最基本的体现。我们可以如此不费力气的阐释我们看到的东西,但是对于计算机来说,这却是令人难以置信的复杂。在它看来,一幅数字图像仅仅是一系列像素点组成的集合,没有任何语义上的含义,它无法直接地知道哪些像素点应该组合起来形成一个物体,或者哪些像素点是属于背景的内容。更糟的是,即使图像中的物体或目标本质上并没有发生变化,但只要它们的姿态,尺度或
5、者方向甚至光照影响下的颜色稍微有点不同,这个像素集合就可能完全不同,这给计算机对图像进行处理和识别带来了极大的困难。四十多年来,计算机视觉领域一直在对图像处理和识别算法进行不断地探索,但是始终没有找到一种更普遍的方法来解决这个问题,这是一个有非常广阔前景的领域,我希望能够为它做出我的一点微薄贡献。在近年来的计算机视觉研究中,多视图像处理这个领域受到了广泛关注[1][2][3],就好像人有两只眼睛一样,对同一场景在两个或者多个不同角度拍摄得到的多个视图使得第1页第一章绪论我们能够跳出图像的平面站在与人类感知更加一致的三维空间中揭示出图像之间隐藏的更多信息,因此具有良好的
6、应用前景。人类通过视觉神经经过大脑可以将两只眼睛看到的图像在内部关联起来以形成一个带有深度信息的三维感觉,那么在多视几何中,对每个视图进行单独处理必然不能发挥多视图像的优越性并且也失去了与人眼特性的一致性,因此我们要把多视图像联系起来,研究它们之间的相互关系,比如几何关系,对应关系等,这种多视图像之间的关联奠定图像匹配,图像检索和三维场景重建等应用的理论基础。然而,要得到多视图之间的相互关系,一种方法是我们纯粹基于多视图像之间的像素点对应关系来表示。比如对于一幅图像中的某一像素点,我们找到它在另一幅图像中对应的像素点。这里的“对应”并不是指像素点的灰度值一样,而是指它
7、们是同一个三维空间点在这两幅图像中的投影。寻找这样一种对应关系一般有很大的局限性,比较适合拍摄两幅图像所用的摄像机的光心相距较近的情况,因为这种情况下一幅图像中的像素点与另一幅图像中对应的像素点距离相差不会太远,而且像素点在大范围内都具有一致的对应性。这种情况与人的两只眼睛类似,因为人的两只眼睛相距较近,两只眼睛分别看到的画面相差并不大,所以所有像素点整体的对应关系即可以表示多视图之间的相互关系,而且也可以产生有效的视差[2]以获得三维的信息。另一种获得多视图之间相互关系的方法是基于多视图之间的全局几何关系。这种全局几何关系一般可以定量来表示,比如已
此文档下载收益归作者所有