资源描述:
《数字视频图像质量客观测量方法的改进与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、数字视频图像质量客观测量方法的改进与实现发布时间:2006年11月25日点击次数:246来源:电子设计信息网-www.edires.net 作者:黄文辉陈仁雷张家谋 摘要:本文在传统的图像客观测试峰值信噪比的基础上,对比了重建图像与原始图像,改进了测试模糊及方块效应等关键质量指标的算法,同时提出了预处理的方案.实用中可与图像质量主观评价的MOS(meanopinionscore)对应,并可用于测试与评价图像传输系统的质量.关键词:图像质量客观测试;峰值信噪比;模糊;方块效应引 言图
2、像质量评价分为主观评价和客观评价,主观评价是以人作为观察者,而图像最终是给人看的,所以人(特别是专业人员)的评定是具有权威性的.但主观测试具有局限性,时间长,不利于日常的研究.同时,人的视觉反应到主观感觉上有其心理因素,结果因人(甚至因时)而异,很难形成统一的模型,因而需要寻找简单易行且能得到公认的客观测试方法,并根据主观评定定出指标,对图像、视频的质量做出定量的客观评价.即这些客观测试方法的指标应该与主观评价对应起来.研究数字图像质量的传统方法是求出重建图像与原始图像的差别,将这些差别统一认为
3、是噪波,并以峰值信噪比(PSNR)的分贝数作为指标客观地表征数字图像质量.但是PSNR只是一个综合的结果,它并不能反应是哪一种原因造成图像的降质,因而在实际中很有必要再分项深入研究能表征图像降质原因的方法,也就是为常见的公认的数字图像的各种失真寻找出相应的测试方法.而这些方法至少有下列3条原则是必需满足的:①与主观质量评价相一致;②能突出表征一种失真造成的后果而不受或尽量少受其他失真因素的影响;③对失真程度的数量表征明显,并尽量有线性的相关性等.本文提出以PSNR为总的测试指标,以模糊系数、方块
4、效应、运动补偿、帧速为分量的测试方案,并在文献[1]的基础上对PSNR、模糊及方块效应提出了改进方案.1 PSNR计算PSNR公式中原始图像(输入图像)的信号幅度多取255,认为原始图像信号处于理想的满幅度状态,图像中亮度(或色度)最大处为峰值255,亮度(或色度)最小处为谷值0.这些值经过处理后成了重建图像(输出图像),信号值产生了偏离,导致了图像失真.这种计算方法约定俗成已成定式,但是仔细分析后,实际的图像很难达到如此理想的状态.即在一幅实际图像中,并不一定(或很难)都存在最亮点或最暗点,此
5、时若一概以输入图像的幅值为255计算则显然是不正确的.在这种情况下应以输入图像实际存在的亮度(或色度)最大值和最小值进行计算才是正确的.故本文建议采取如下公式计算PSNR(下列的计算以图像亮度为例):均方差为其中,N为输入图像或输出图像第k帧的像素总数;yi(i,j,k)为输入图像第k帧的第i行、第j列的像素亮度值;yo(i,j,k)为输出图像第k帧的第i行、第j列的像素亮度值;Yo,max(k)、Yo,min(k)分别为输出图像第k帧中最大、最小像素亮度的值.有些学者认为,如果输入图像的幅度差
6、达不到255,只要先归一化到255,仍可以用输入图像信号幅度为255的公式计算PSNR.实际上,这不符合实际图像的传输幅度,而在传输过程中却免不了有非线性的存在,导致了计算误差.因此,直接与输入图像最大值与最小值之差相比,更能反映实际的PSNR.2 斜空间滤波求模糊系数图像清晰度是视频图像最根本的指标,一幅图像是否清晰并被观看者认可是该图像系统成败的关键.当然,决定图像清晰度的根本是图像的像素含量,怎样在有限的像素数的限制下取得更高的清晰度,是广大相关专业的科技工作者孜孜以求的.图像清晰度的下降
7、源于图像信号中高频成份的损失,一般表现为边缘模糊和细节减弱.实用中,由于图像格式(像素数)不同,图像清晰度的客观测试只能是测量与原始图像(输入图像)相比清晰度的下降程度.在前人研究成果的基础上,文献[1]选择了一种求清晰度的方式,即分别对原始图像和重建图像用微分型空间滤波器提取其高频成份,再求二者的相对差值,定义为“模糊系数”.经过实际应用,发现它存在2个问题:①与图像清晰度下降的主观感觉相关性不好,且受图像内容影响太大,不同的图像得出的值相差较远(见表1);②受图像方块效应的影响太大.方块效应
8、造成了附加的垂直与水平边缘,增加了图像的高频成份,影响了测试结果.为此,改为用斜空间滤波求模糊系数,算法流程如图1所示.图1模糊系数计算流 考虑到图像传输系统对边缘和细节的传输一般是无方向性的,因此斜方向边缘和细节的传输系数可以代表垂直、水平方向的细节传输,而由于输出图像的水平、垂直细节与方块效应混在一起,不易代表模糊程度,故选斜方向的微分型空间滤波器(见图2),只比较斜方向边缘和细节的传输,即可代表整个图像边缘和细节的传输系数,即模糊系数:其中斜边缘能量特征为其中y′f(i,j,k)为第k帧、