西安交通大学-数字媒体实验报告.docx

西安交通大学-数字媒体实验报告.docx

ID:59131862

大小:628.84 KB

页数:18页

时间:2020-09-12

西安交通大学-数字媒体实验报告.docx_第1页
西安交通大学-数字媒体实验报告.docx_第2页
西安交通大学-数字媒体实验报告.docx_第3页
西安交通大学-数字媒体实验报告.docx_第4页
西安交通大学-数字媒体实验报告.docx_第5页
资源描述:

《西安交通大学-数字媒体实验报告.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数字媒体课内实验专业班级计算机15/计算机14班学生姓名高君宇/吕智龙学号/提交日期2014年11月23日Email@qq.com实验分工以下三个实验为高君宇和吕智龙合作完成,其中吕智龙主要负责分析实验要求,拟出实现的基本算法,提出大致框架,并对最终的代码进行优化。高君宇主要负责代码的实现和调试。两人共同完成最终的实验报告。实验一、二维DCT变换题目描述将给定一幅RGB图像•转化为YUV图像,•对色差分量进行4:2:0的降采样,4:1:1的降采样,和4:2:2的降采样•对4:2:0的降采样结果,分别将Y,U,V通道的图像划分成8×8的图像块,计算每个小块的二维DCT变换,•每个图像块对

2、应有8×8=64个DCT系数,分别选用前4个,6个,8个,12个,24个系数重构图像。工具选择pMatlab2014a原图像如下:实验算法1.读入bmp图像;2.将图像的RGB空间转换成YUV空间(未进行伽马矫正);3.对色差分量进行4:2:0采样4:2:0并不意味着只有Y,U而没有V分量。它指得是对每行扫描线来说,只有一种色度分量以2:1的抽样率存储。相邻的扫描行存储不同的色度分量,也就是说,如果一行是4:2:0的话,下一行就是4:0:2,再下一行是4:2:0...以此类推。对每个色度分量来说,水平方向和竖直方向的抽样率都是2:1,所以可以说色度的抽样率是4:1。对非压缩的8比特量化

3、的视频来说,每个由2×2个2行2列相邻的像素组成的宏像素需要占用6字节内存。4.进行DCT变换:1.构造一张Zigzag表,使用Z形变换扫描,对变换的DCT系数保留合适的个数(4,6,8,12,24);2.DCT逆变换,图像重构,转回RGB空间。实验结果及分析1.4:2:0采样下DCT系数保留前4个,恢复出的图像:DCT系数保留前6个,恢复出的图像:DCT系数保留8个,恢复出的图像:DCT系数保留12个,恢复出的图像:DCT系数保留24个,恢复出的图像:可以看到,随着保留的DCT系数的个数不断增多,恢复出的图像的质量不断增强。注:实验时我曾经忘记做DCT逆变换,曾出现如下结果让我记忆颇

4、深:所以,进行数据分析和处理时一定要细心,把每一步骤都做好,浮躁是不行的。2.4:1:1采样原图采样后3.4:2:2采样原图采样后可以看到,4:1:1采样和4:2:2采样后的图像和原图都有一定的差距,4:2:2采样后失真更小。源程序见文件夹E1。实验四、运动估计题目描述给定视频流中截取的前后两帧图像,保存成BMP的格式,第一幅图像作为参考帧,第二幅图像作为当前帧,试:•从三步算法,2D对数算法,对偶算法三种运动估计算法中选择2种,编写相应程序,估计每个16×16宏块的运动;•根据估计的运动,进行运动补偿,计算每个宏块的差值,并且将差值保存成一幅图像。工具选择Matlab2014a原视频

5、帧如下:参考帧当前帧实验算法1.读入要处理的参考帧和当前帧;2.对参考帧进行边界处理,为其增加一个高度为32的边框,便于运行3D搜索法时处理边界值;3.对参考帧用3D搜索法进行运动估计:每次搜索9个点,确定一个最小的位置,然后再进行将搜索距离减半,继续9个点,循环迭代。选用MSE作为误差函数;4.计算当前帧中每个16*16宏块与参考帧中用3D搜索法得到的对应位置的16*16宏块的差值,选用MSE作为误差函数,选择误差最小的那个宏块作运动补偿;5.将所有对应宏块的差值保存成一副图像。6.使用2D对数法重新进行上述步骤。2D对数搜索法:每次搜索5个点,确定一个最小的位置,当遇到搜索区域的边

6、界或者最小值在中心点时候,减少搜索距离,继续搜索5个点,循环迭代。实验结果及分析1.3D搜索法的结果:2.2D对数法的结果:可以看出,对于这两帧图像,使用3D搜索法得到的运动误差更小。3.总结:这个实验中出现了很多错误,由于一开始对算法的理解不够透彻,我犯了如下错误:(1)搜索宏块时忘记更新节点坐标;(2)比对MSE误差时,没有及时更新最小误差值;(3)进行运动补偿时,错误的使用了当前帧和当前帧的差值;所以,一度出现了如下结果:我的体会是,实现一个算法之前,必须先要熟练掌握这个算法,做到每一步都了然于胸,才不至于编程时手忙脚乱。源程序见文件夹E4.实验七、WAV格式分析题目描述给定若干

7、段用WAV格式保存的音频数据•用UltraEdit等工具分析保存的WAV音频数据格式。工具选择UltraEdit32分析过程及结果待分析的音频大体信息如下:从这里可以看出这是一个43.1KB的wav格式的音频文件。这里面并没有什么有用信息,试听了一下,发现是发生频率不同的两声蜂鸣器的声音组成的一个两秒的音频。使用UltraEdit打开该音频文件,内容如下:其中,第一行0-3(00H-03H,下文按照这种十六进制的表示叙述)列表示的是”RIFF”

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。