资源描述:
《第二章图像和视觉基础ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二章图像和视觉基础数字图像基础知识人类的视觉感知系统2.1视觉基础1.人眼成像结构图桂林理工大信科院2.亮度视觉人眼的结构机理使人能感觉到亮度和颜色人眼成像的结构Ciliarybody睫状体眼睛血管膜的增厚部分,在脉络膜和虹膜之间Ciliarymuscle睫状肌Retina视网膜Lens晶状体Fovea中央凹Sclera巩膜choroid脉络膜视网膜上的锥细胞产生适亮视觉(photopicvision);柱细胞产生适暗视觉(scotopicvision)Cones-锥细胞Rods-柱细胞亮度视觉范围很
2、宽:1010数量级光强度与主观亮度的对应关系强光极限夜间白天夜视阈值刻画亮度分辨率的基本实验韦伯率,亮度区分能力韦伯率是灰度的函数可知人眼区分亮度的能力在低照明的情况下较差,在背景亮度增加后得到改善;但不与照明的情况成一简单的函数关系-基于下面两个事实桂林理工大信科院事实1:马赫带效应-边缘效应人眼过高估计了不同亮度区域边界的值桂林理工大信科院imagesc(1:8)colormap(gray)事实2:同时对比度人眼感觉到的亮度还和对比度有关2.2.1图象和数字图象图象:用各种观测系统以不同形式和手段观
3、测客观世界而获得的,可以直接或间接作用于人眼并进而产生视知觉的实体粗略地说,图像是二维或三维景物在视网膜上的影像,人类采用计算机技术接受并加工这种视觉信息的理论、方法和应用称为计算机图像处理和分析图象(广义/抽象)图像(狭义/具体)图象和信息:人类从外界(客观世界)获得的信息约有75%来自视觉系统1.1.1图象和数字图象图象类型{广义}图片,动画,绘图,文字/档,...{狭义}单幅序列图象,...静止运动图象(视频),...2-D3-D,彩色,立体对,多光谱,多视场图象,...灰度深度,纹理图
4、象,...1.1.1.3图象的表达图象表示2-D数组f(x,y)x,y:2-D空间XY中坐标点的位置f:代表图象在(x,y)的性质F的数值f,x,y的值可以是任意实数性质F:可对应不同物理量(例如灰度、红、绿、兰)灰度图象里用灰度表示连续图像:f,x,y的值可以是任意实数数字图像:f,x,y的值是整数图像数字化空间坐标离散化(采样):连续坐标(x,y)离散坐标(i,j)i=0,1,2,,M-1;j=0,1,2,,N-1灰度值离散化(量化):对每个样本值进行二进制编码连续图像离散图像数字图像一般取:行
5、(或列)的样点数:;灰度量化级数:图像数字化过程f(x,y)X,单位:mycr,单位:pixelf(5,4)CCD传感器上的连续图像采样量化后的数字图像1.1.1.3图象的表达图象的矩阵和矢量表示一幅2-D图像可以用2-D数组f(x,y)表示,实际中将2-D图像写成2-D的M×N的矩阵矩阵矢量1.1.1.3图象的表达离散点集灰度区域二维数组屏幕显示坐标系统灰度区域迪卡尔坐标系统桂林理工大信科院桂林理工大信科院MATLAB图像及其操作开发图像处理的应用系统不可能由一个人完成,而是一个群体协作的工程。设计方
6、法通常采用结构化或面向对象方法。如果只就图象处理的某个算法而言,就是一项软件工程设计中的模块设计工作,用MATLAB工具做这样的算法编程工作是一件轻而易举的事情。任何一个图像处理算法都可以是一个自定义的函数,MATLAB提供了一个创建用户函数的结构,并以M文件的形式存储下来,运行M文件,就是让计算机一次完成M文件规定的操作。例:图像文件读取和显示函数的编制函数文件,文件的开头第一行为function的文件。1.建立函数文件在编辑/调试窗口键入:2.保存函数文件保存的函数文件名应与用户定义的函数名一致,此
7、例中定义的函数名为“RGBimread”,则文件保存为“RGBimread.m”3.调用函数文件在命令窗口输入:命令窗口图形窗口MATLAB图像及其操作开发图像处理的应用系统不可能由一个人完成,而是一个群体协作的工程。设计方法通常采用结构化或面向对象方法。如果只就图象处理的某个算法而言,就是一项软件工程设计中的模块设计工作,用MATLAB工具做这样的算法编程工作是一件轻而易举的事情。MATLAB图像文件格式MATLAB图像类型MATLAB图像文件的读写MATLAB图像对象属性1.MATLAB图像文件格式
8、MATLAB的图像文件格式有两种:一种是矢量形式另一种是光栅形式矢量文件像程序,通过执行命令画出图案,适合图形数据文件;光栅文件,描述图像的像素信息,比较适合色彩、阴影或形状变化复杂的图像。MATLAB支持以下几种图像文件格式:PCX格式,分为1、4、8、16、24位图像数据,文件内容包括:文件头(128字节)、图像数据、扩展颜色映射表数据。BMP(独立位图文件格式),分为1、4、8、24位非压缩图像数据,8位RUNLENGTHENCODE