欢迎来到天天文库
浏览记录
ID:28904461
大小:822.54 KB
页数:35页
时间:2018-12-15
《提升小波的语音端点检测算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、小波变换在语音端点中的应用提升小波的语音端点检测算法研究第35页共35页小波变换在语音端点中的应用摘 要:以小波变换及多分辨分析为理论基础,对语音端点检测中小波系数方差算法和子带平均能量算法进行了分析和研究,利用语音和噪声的频域差别,对这两种算法进行了优化,并应用于端点检测系统中,有效地改善了小波系数方差算法耗时长、实时性差的缺点,并克服了子带平均能量算法只对高斯白噪声检测效果好的局限性,提高了语音端点检测系统的实用性.通过MATLAB软件仿真的实验结果表明,采用优化算法的系统实现了语音端点检测准确性和快速性的最佳匹配,达到了此类检测设备的实用要求.关键词:端点检测
2、;小波变换;系数方差;子带平均能量1引言2第35页共35页小波变换在语音端点中的应用2语音端点的一般原理32.1语音端点技术的基本要求32.2语音端点的分类43语音端点53.1语音端点典型算法53.2水印攻击分析73.3小波域语音端点93.3.1小波变换的语音端点算法93.3.2实验结果及分析123.4基于DCT变换的语音端点133.4.1DCT域语音端点133.4.2本章算法及实验结果分析174小波变换在数字音频水印中的应用184.1数字音频水印系统的评价标准194.2DWT域音频水印算法214.3DCT域音频水印算法224.4实验结果分析235视频水印概述及算法
3、分析255.1视频水印的分类256程序附录25第35页共35页小波变换在语音端点中的应用1引言随着计算机网络和多媒体信息处理技术的发展,使得方便快捷地制作、编辑、复制和传输各种无失真的数字化产品成为可能,如数字化的图像、视频、音频、软件、图形、动画和文本等。这给人们带来很大便利,也同时带来了许多严重的安全问题。例如,数字媒体产品的版权保护、软件产品的盗版、数字文档的非法拷贝、各种数字信息的篡改等。对于上述问题,人们最初的想法是求助于密码学。密码学是保护数字媒体内容最常用的方法。数字内容在发送之前先进行加密,合法的用户可以利用密钥来解密加密文件。对于非法用户来说,没有
4、密钥文件毫无用处。然而,密码系统可以保护内容的传输,却无法跟踪合法消费者怎样处理解密后的内容。此外,加密后的文件因为不可理解而妨碍了数字化信息的传播。由此可知,加密手段存在着一定的缺陷。为此,人们开始寻找新的解决办法来补充密码系统,使内容在解密后,仍可以得到保护。随着对这些问题的深入研究,语音端点(DigitalWatermarking)技术产生了,它属于信息隐藏技术(DataHiding)的范围[1-6],最初的目的是作为保护数字版权的补充办法[7]。由于水印信息置于所保护的内容之中,在正常使用时也不会被去掉,因此水印技术可能满足上述要求。语音端点技术利用多媒体信
5、息中存在的冗余信息及人类感知系统的特性,在不影响原始多媒体信息格式和质量的前提下把额外的信息(即水印)隐藏到多媒体信息中。语音端点是一个多学科高度交叉的新兴研究领域,它涉及了信号处理、密码学、数学理论、通信理论、编码理论、数据压缩和人类听视觉理论等多门学科。语音端点的提出是为了保护版权,然而随着水印技术的发展,人们已经发现了水印更多更广的应用。目前,语音端点技术的应用大体上可以分为版权保护、数字指纹、认证和完整性校验、内容标识和隐藏标识、使用控制、隐蔽通信等几个方面。水印原始信号密钥编码器嵌入水印后信息原始水印待测信息密钥解码器检测结果或提出兵水印图1水印信号嵌入系
6、统模型图2水印信号检测系统模型第35页共35页小波变换在语音端点中的应用2语音端点的一般原理语音端点技术包含水印的嵌入、提取/检测两个过程。数字作品拥有的特定信息,如数字序列、数字标识、文本或图像等,按某种算法嵌入到数字作品中,在需要时,通过相应的算法提取出该水印,从而能够验证数字作品的合法性。为了给攻击者增加去除水印的难度,目前大多数水印制作方案都采用密码学中的加密体系来加强安全性,在水印的嵌入和提取/检测时采用一种密钥,甚至几种密钥联合使用。语音端点的嵌入过程如图1所示,语音端点的提取/检测过程如图2所示。2.1语音端点技术的基本要求语音端点必须具有隐蔽性、鲁棒
7、性、安全性等基本特性。其中,隐蔽性和鲁棒性是一对相互对立的要求,提高鲁棒性就会降低水印的隐蔽性,提高水印的隐蔽性又会减弱水印的鲁棒性。因此一个好的语音端点算法,必须合理地均衡二者之间的矛盾,在一定范围内寻求一种最佳的平衡。1.安全性:语音端点的信息应是安全的,难以篡改或伪造,同时,应当有较低的误检测率,当原内容发生变化时,语音端点应当发生变化,从而可以检测原始数据的变更;当然语音端点同样对重复添加有强的抵抗性。2.隐蔽性:语音端点应是不可知觉的,而且应不影响被保护数据的正常使用;不会降质。3.鲁棒性:是指在经历多种无意或有意的信号处理过程后,语音端点仍能保持部分
此文档下载收益归作者所有