《基于信息隐藏的实时语音传输系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
中山大学硕士学位论文基于信息隐藏的实时语音传输系统的研究姓名:李民政申请学位级别:硕士专业:通信与信息系统指导教师:黄继武2003.5.1 摘要本文首先阐述了信息加密技术的原理、发展阶段,及信息隐藏技术的基本概念、原理和方法,然后对信息加密技术、信息隐藏技术的优缺点加以比较分析,提出了一个新的信息隐藏传输系统的设计思路,该系统能弥补传统保密通信系统(加密解密技术和隐写术)的不足。然后对系统的设计实现的相关环节进行深入的剖析,包括:1.语音话息隐藏传输系统的总体设计目标、思路和要求,及选择语音作为信23息隐藏媒体的原因。语音信息隐藏传输系统涉及的关键技术:包括语音的采集播放:语音的压缩解压;语音中信息的嵌入和提取技术:语音的传输技术。基于PSlN网的语音信息隐藏系统传输系统的设计实现:系统的设计思路,语音采集播放、压缩解压的编程实现,利用小波变换实现语音中信息嵌入和提取的算法,利用Modem编程完成语音在PSTN网上的传输,系统各环节协调工作的编程控制实现。基于IP网的实时语音信息隐藏传输系统的设计思想:如何利用RTP协议进行实时语音的传输和控制,IP网上传输数字语音的Qos控制机制。!关键词:密码学,信息隐藏,隐写术,—§音广PsTN,IP网,Q。s TheresearchofRealTimeVoiceTransportingSystemBasedonInformationHidingCommunicationandInformationSystem。LiMinzhengProfessorHuangJiwuABSTRACTprincipleandseveraldevelopingphasesofcryptologytechnologyalongwiththebasicconceptsandprincipleandmannersofinformationhidingtechnologyarefirstlystatedinthispaper.Advantagesanddisadvantagesofbothcryptologytechnologyandinformationhidingtechnologybycomparingthemwitheachotheraregivensecondly.Afterthatanewideaofinformationhidingtransportingsystemisproposed,whichrecuperatesthedisadvantagesoftraditionalcryptologycommunicationsystemofcryptologyandsteganography.Andthenthoroughanddetailedexplanationofthedesignprocessofthissystemispresentedincluding1.111egoal.requirementsandschemeofvoicetransportingsystembasedOilinformationhiding.andtheadvantagesofselectingvoiceasthemediaforinformationhiding.2.Thekeytechnologyofvoicetransportingsystembasedoninformationhiding,includingvoicecollectingandplaying,voicecompressionanddecompression,informationembeddingandextractingandvoicetransporting.3.ThedesignandrealizationofvoicetransportingsyStembasedoninformationoverPSTNincludingitsgeneralscheme,voicecollectingandplaying,voicecompressionanddecompressionbysoRware,algorithmforembeddinginformationintovoicedataandexhalinginfolrmationfromitbasedonwavelettransform,voicetransportingoverPSTNbyamodem,andthecontrolforallthepanstocooperatewithoneanothereffectively.4.ideaofvoicetransportingsystembasedoninformationoverIPnetwork,includingtherealtimevoicetransportingandcontrolbyRTPprotocol,andthecontrolmechanismofQOSofvoicetrasportingoverIPnetwork.Keywords:cryptology,informationhiding,steganography,voice,PSTN,IPnetwork,Qos 第1章信息加密与信息隐藏技术第1章信息加密与信息隐藏技术本章首先介绍了信息加密技术的原理,然后介绍信息隐藏技术的基本概念、原理和方法,并对信息隐藏和信息加密技术的优缺点加以比较,最后提出一个新的基于信息隐藏通信系统的方案。1.1课题选题背景保密通信系统发展至今,主要有两种基本的保护方法:一种是利用密码术对明文实施各种变换,使它不为局外人所理解。但这种利用随机性来对抗密码攻击的技术,在防止他人从中的到信息的同时,也暴露了重要消息的传输存在,因此容易引起成为攻击者的注意,在实际的应用中,这一点应是极力避免的。另一种方法是应用信息隐藏的技术即隐写术,利用某种方法能够隐藏信息的存在,具有很强的伪装性,不易引起攻击者的注意。随着信息技术的发展,为信息隐藏提供了一种新的思路,利用载体信息中具有随机特性的冗余部分,将重要信息嵌入到载体信息之中,使其不被人发现。在科学实践中,具有冗余特性的载体非常丰富,这一点也在客观上增强了信息隐藏技术的隐蔽性和可行性。通过把信息存在本身隐藏起来的技术使得攻击者无从获取密码信息的位置,从而增强了安全性。如果在信息嵌入之前对其进行加密预处理,则嵌有信息的载体数据将具备抗攻击性和强伪装性,这一点是传统隐秘传输系统所不具备的。本文就是基于这一思想,提出了一种新的隐秘传输系统的设计方案,并深入剖析该系统在实现中需要解决的问题和技术细节。 第l章信息加密与信息隐藏技术1.2加密技术1.2.1加密技术的基本原理加密解密技术就是利用密钥把信息变换成密文使外部不可理解【98].通过公开信道发送到接收端,没有密钥的非法用户无法进行解密,也就无法正确使用保密信息,此种方式的通信模式如图l所示。图1—1:保密通信模式框图被隐蔽的消息称作明文,隐蔽后的消息称作密文[3l’将明文变换成密文的过程称作加密,其逆过程,即由密文恢复出明文的过程称作解密。对明文进行加密时所采用的一组算法称作加密算法,对密文进行解密的一组算法称作解密算法。加密和解密的算法的操作通常是在一组密钥的控制下进行的,分别称作加密密钥和解密密钥。根据密钥的特点,将密码体制分为对称和非对称密码体制,对称密码体制又称为单钥或私钥密码体制,非对称密码体制又称为双钥或公钥密码体制。在私钥密码体制中,加密密钥和解密密钥是一样的或彼此间容易相互确定。在公钥密码体制中,加密密钥和解密密钥不同,很难从一个推出另一个,可将加密和解密能力分开。在消息传输和处理系统中,除了意定的接收者之外.还有非授权者,他们通过各种途径窃取机密消息,称其为截收者。他们虽然不知道密钥,但通过分析,可能从截取的密文中推断出原来的明文,这一过程称作密码分析。对一个密码系统采取截取密文进行分析的这类攻击称作被动攻击。密码系统还可能遭受的另一类攻击称作主动攻击,即非法入侵者主动向系统窜扰,采用删除、更改、增添、重放、伪造等手段向系统注入假消息,以达到损人利己的目的。所2 茆I章信息加密与信息隐藏技术谓一个密码是可破的,是指如果通过密文能够迅速的确定明文和密钥,或通过明文密文能迅速的确定密钥。破译或攻击密码的方法有穷举破译法和分析法两种。穷举法又称作强力法和完全试凑法,是对截取的密文依次用各种可能的密钥试译,直到得到有意义的明文,或在密钥不变的情况下,对所有可能的明文加密,直到得到和截取密文一样为止。分析法又分为确定性分析法和统计分析法两类。确定性分析法是利用一个或几个已知量用数学公式表示出所求未知量。统计分析法是利用明文的己知统计规律进行破译的方法,密码分析者对截取的密文进行统计分析,总结出期间的统计规律,并与明文的统计规律进行对照比较,从中提取出明文和密文之间的对应或变换信息。密码分析之所以能够成功地破译密码,最根本的原因是明文中有多余度。根据密码分析者破译时己具备的条件,通常人们将攻击的类型分为四种,分别是:(1)唯密文攻击:密码分析者有一个或更多的用同一个密钥加密的密文,通过对这些截取的密文进行分析得出明文或密码。(2)已知明文攻击:除待解的密文外,密码分析者有一些明文和用同~个密钥加密这些明文所对应的密文。(3)选择明文攻击:密码分析者可得到所需要的任何明文所对应的密文,这些密文与待解的密文是用同一个密钥加密得来的。(4)选择密文攻击:密码分析者可得到所需要的任何密文所对应的明文,解密这些密文所使用的密钥与待解密的密文的密钥是一样的。1.2.2加密技术的发展历程第一阶段可称之为古典密码学,主要有代换密码和置换密码,代换密码有分为单表代换密码,多表代换密码,和多字母代换密码。还有~种特殊的代换密码,即代换并没有改变明文字母,只改变了他们的位置,密码学上称这种代换密码为置换密码,又称作换位密码。第二阶段可称之为私钥密码算法,即加密密钥和解密密钥是一样的或彼此间容易相互确定。私钥密钥体制根据对明文消息加密方式的不同分为两大类,3 第1章信息加密与信息隐藏技术即流密码和分组密码【9s1。一个流密码将消息分成连续的符号x=xl,x2⋯⋯⋯用密钥流k=kl,k2,k3,⋯⋯⋯.的第i个元素ki对xi加密。分组密码是将明文消息编码表示后的数字序列xl,x2,x3⋯.划分成长为m的组x=(xl,x2,x3⋯⋯⋯m),各组(长为in的向量)分别在密钥k=(k1,k2,k3⋯⋯.kt)的控制下变换成等长的输出数字序列。第三阶段可称之为公钥密码算法,私钥密码系统的一个严重的缺陷是在任何密文传输之前,发送者和接收者必须使用一个安全信道预先传送密钥。实际中,达到这一点是很难的。在公钥密码系统中,解密密钥和加密密钥不同,从一个难于提出另一个。解密和加密是可分离的。通信双方无需事先交换密钥就可建立保密通信。主要的算法有RSA算法,MerkeHellman算法,背包算法,McElice算法,E1Gamal算法和椭圆曲线算法。如图1—2所示。密码学厂一代换密码古典密码学一L置换密码私钥密码公钥密码流密码分组密码RSA算法llerke—Hellnar薄法背包算法McEliCe算法EiGamal算法椭圆曲线密码算法图1—2:加密算法分类4 第1章信息加笛与信息隐藏技术1.3信息隐藏技术信息隐减(InformationHiding)是信息安全和多媒体信号处理(MultimediaSignalProcessing)领域一个非常年轻但又发展迅速的研究方向,是一个结合图象/语音/视频信号处理与密码学、通信理论与方法、听视觉科学的多学科交叉技术领域。由于其在军事、政务、工业界己逐步呈现的巨大潜在应用价值,近年来得到了学术界和工业界的高度重视。随着数字媒体(数字音频、数字图象、数字视频等)和Internet应用的不断普及,各种网络多媒体信息服务的开展日益广泛。这些服务在丰富信息社会的生活并给人们带来方便的同时,也给信息拥有者的合法权益造成了潜在的威协。数字媒体产品的版权保护已成为迫切需要解决的问题。信息隐藏方法可望在技术上为数字信息及其所有者权益提供有效的保护工具。另一方面,涉密信息在传输和存储中的安全则是许多政府部门、企业和个人十分关心的问题。党政机关和军事部门的涉密文件和资料、工业上正在研制的新产品造型、尖端科学研究数据与图象、新兴的电子商务在网上交换的信息(如电子合同书等)等等,如何保证它们在网络和其它信道上传输的安全,在通信网络越来越发达的今天,显的无比重要。1.3.1信息隐藏的基本原理信息隐藏的可能性来自于多媒体数据的数据冗余(redundancy),从听视觉科学和信号处理的角度,信息隐藏可咀视为在强背景(原始图象/语音/视频等)下迭加一个弱信号(隐藏的信息)。由于人的听觉(HumanAudioSystem,HAS)系统和视觉系统(HumanVisualSystem,HVS)分辨率受到一定的限制,只要迭加的弱信号的幅度低于HAS/HVS的对比度门限,HAS/HVS就无法感觉到信号的存在。对比度门限受HAS/HVS的特性和宿主信号的时间,空间和频率特性的影响。因此,通过对原始图象/语音,视频做有限制的改变,就有可能在不改变听觉/视觉效果的情况下嵌入一些信息。图l一3为信息隐藏的基本原理框图。 第1章信息加密与信息隐藏技术听视掩密信号隐藏信息圈1—3:为信息隐藏的基本原理框图对于一定尺寸和频率特性的宿主信号,在满足不可感知性的前提下,允许隐藏的信号总功率是一定的。隐藏信号宿主信号特征分析和听视觉滤波器的作用在于引入听视觉系统特征,以合理地分配隐藏信号分量的局部能量,从而尽可能提高稳健性和信息隐藏容量性能。最终嵌入宿主信号的数据将是处理后的隐藏信号和宿主信号特征的合成,引入宿主信号特征的优点在于使嵌入数据与宿主信号相关。从信号处理的角度分析,这将可以使消除隐藏数据的攻击变得更加困难。1.3.2信息隐藏的分类根据应用场合的不同需求,信息隐藏技术可分为隐写术和数字水印二个主要分支.如图1—4所示。隐写术的研究重点如何实现信息伪装;而数字水印则需要着重考虑稳健性的要求,以对抗各种可能的攻击。依据隐藏协议,信息隐藏还可分为无密钥信息隐藏、私钥信息隐藏、公钥信息隐藏。信息隐商隐写数字水印无密钥信息隐藏私钢信息隐藏公钥信息隐藏图1—4:信息隐藏分类6 第l章信息加密与信息隐藏技术1.4隐写术(Steganography)隐写术起源于生物学或生理学,最典型的例子就是许多动物都懂得利用保护色将自己隐藏在周围的环境之中。而人类自身对隐写是的应用也可追溯到远古时代,据记载.波斯宫廷有个叫Demeratus的人””想通知它的希腊的朋友关于Xerxes一世将入侵希腊的消息。于是,他将这条消息隐藏在写字板下面。当时的写字板是两片木头像书一样装上合叶组成的,木头的每一面都覆盖着蜡。发送方在蜡上写字,接收者将蜡融化之后有可以重新使用写字板。Demeruas的方法是将蜡除去后在木头上写上消息,然后用蜡将其重新覆盖,之后将表面上空白的写字板送往希腊。Herodots还讲述了另一个故事⋯,Histaies为了通知他的的朋友们发动暴动来反抗波斯人,就剃光了一个仆人的头,然后将信息纹在头上,等到头发长出来后叫他出去送信,他的朋友剃调仆人的头发,就看到了密码信息。隐写术发展过程中的一项重要技术是感应墨水的使用,其基本原理是发送方使用某种无色化学药品在传输媒介(如纸张)上写下密码信息并发送出去,接收方则利用一定的化学药水来对隐写媒介进行处理,这些化学药品所发生的化学反应会将隐藏的结果表现出来。在第一次世界大战和第二次世界大战期间,这一技术得以改进,使得化学反应只能在特定的显影剂的作用下才可能发生。摄影术的使用是隐写术发展过程中的另一项重要技术。这是由于摄影术可以大幅度的缩放图象,将一页纸张或图片信息做的非常小,使其更便于隐藏。在普法战争中呻1,当巴黎被围困时,城中的人们为了将消息送出城外,就把写的信拍摄下来,把大约1英寸的图象缩影成胶卷中的半英寸,然后将胶卷绑在鸽子腿上,让他们飞出巴黎将消息送往目的地,这个例子至今还可以在巴黎的邮政博物馆中看到。随着更好的透镜被研制出来,同时薄膜也发展到分子的分辨率,摄影师可以将图片的尺寸缩小到一个印刷点的大小,第二次世界大战中,德国间谍将这样的图片微粒粘贴在印刷品中的句号位置,从而将信息传递出去。扩频技术的引入将隐写术扩展到应用更广泛的频率带宽上。一般的扩频系统通过将数据编码为一个在旁观者看来是噪声,而持有密钥的合法接受者却可1 第1攀信惑加密与信慰聪减技术瞄读出的二避制序列寒传递瀵息。游患的发送者燎淤息分成麓短鲍足部分,然后通过一个预先安排好的频率序列发送出去,但是在一个特定的频率上发出的窝分要足觞懿短,这樽孝笼镶涎篮褫者不会注意到德。以上关于隐写术的内容都是将需要密码传递的消息记录下来,然后通过其蠡蔓擦奔发送出去豹技术。豫写零还有勇井一个分支怒涛“记录”这个行为本身隐藏起来,我们称之为“语义隐写术”,即消息由隐藏的“写”的语言或语言形式缀成。语义隐写术包括符号码、豫语以及虚字密码等。所谓一个符号码是指一次非书磁形式哟密码通信。在筵二次世赛大战中8⋯,枪查者截获了一船手表,由于担心手表的指针位置会拼出一个密码信息,恁们在检查过理中对臻针懿位矍遴行了调整。这秘裁鼹手表搬针位鬟来传递密秘信息的技术就属于语义隐写术。其他一些利用图片中草的长叶片作为莫尔斯诲弱划线,短野片{睾为弱点,或篌嗣膏餐幸鼍表字母等密鹃通蕊方式也疆子语义隐写术,同样也是符号码。需耍注意的是,语义隐写术要达到不引人注意的目的,在掩体对象豹选释上应该注意一定的技巧。如巢盍接嗣啻符来代表不磷筋字母,那末符号码产生的乐谱很可能瓣起来和昕起来根本就不像音豚,这样的操作过程并不是一次成功的隐写。在虚字密码中,使用每个零词的第一个字母来攒逊一条消息,但是这样的掩体消息非常难以构造并且听起来会比较奇慑。如果构造者有比较足够的空间霹时溺,劐可以透过蕤心的设诗寒减少一些资异挂。我蓬古代经掌饺嗣豹“藏头诗”就是虚字密码的一种形式。一般说来,经常使用的连续单词被选定的单词来掰成一个句子对,掰鞠威的文零惑是馥熬来有骜古怪,这徉滋较容荔零j筵怀疑。舔有一种几何穗谣,其中最古老的形式怒万向两格。酃在一张纸板上髓枫剪出与密码信息单词长度个数相当的张洞,势制作一个纸板的副本发送给接收方。编码者将他的网格放在一张纸上,然后粳孔洞中写上密码消息。随后拿阡曩据,在单溺匏之阉靛空白越曩其{龟擎词填溅,并姆售传发送出去。接收者熄他的网格放在信上就可以读出密码信息。但熄,与虚字密码相同,在几何隐语串鞫逑整一令读莛栗不雩|天淀意豹楚体售感恣是范较嚣难熬。没舂经过精心设计的网格消息总是听越来很奇怪,因而也常常被检测翥发现。 第1章信.tT,DN出与信息隐藏技术1.5数字水印技术数字水印在近年来信息隐藏的研究中占据主要的位置。水印可以是代表所有权的文字或ID(identification)、图形图象、音频数据、随机序列等。依据宿主信息的不同,数字水印可分为图象水印、语音水印、视频水印、网格水印、文本水印等。图象、语音、视频信号由于具有较大的感觉冗余,因而提供了较大的信息隐藏空间(payload)。依据数字水印的性质,水印可以分为稳健水印(robustwatermarks)和易损水印(ffaNlewatermarks)。二者有着不同的用途。稳健水印主要用于媒体信息的版权保护和所有权认定,因此必须重点考虑承受各种可能的攻击。易损水印还可以进一步分为全易损水印和半易损水印(semi一丘aNlewatermarks)。前者对任何加之于嵌入了水印的媒体信号上的变化敏感,其作用类似于数字签名(diNtalsignature)。后者则对非法窜改敏感而对非恶意的攻击(如可能的数据压缩、噪声干扰等)稳健。在实际中,半易损水印将可能具有更广泛的应用前景。易损水印通过检测嵌入水印的存在与否、真实与否以及完整与否,确保原始媒体信号的可信度。其主要用于多媒体信息的认证和数据完整性证明。与数字签名技术不同,易碎水印并不在文件尺寸上作变化,而是直接在图象中嵌入有意义水印或认证符号;另一方面,数字签名的认证信息与原信息密切相关,原信息的任何改动会导致签名的改变,而易碎水印则可以承受一定的非篡改性的修信息密切相关,原信息的任何改动会导致签名的改变,而易碎水印则可以承受一定的非篡改性的修改。在~些应用场合下,水印的检测允许有原始信号的辅助。而在另外一些场合下,有可能无法得到原始信号。因此,从检测方法的角度,水印又可以分为私有水印(privatewatermark)和公开水印(publicwatermark)。不需要原始宿主信号和原始水印信息的检测方法也称为盲检测(blinddetection/extraction)。通常,由于水印信号与原始宿主信号相比弱得多,达到足够稳健性能的盲检测方法的实现更加困难。借助原始宿主信号的私有水印的抗信号处理、噪声、几何失真的稳健性能更好一些。对于盲检测方法,在裁剪和几何攻击下的水印分量的同步问题将使检测更加困难。q 第1章信息加密与信息隐藏技术从视觉效果考虑,图象水印分可见和不可见二种。可见水印是人眼可阻看见的,主要应用于图片的可见标记,如数字图书馆等。由于其易受攻击,应用范围受到较大限制。不可见(隐形)水印则是视觉系统难以感知的。它通过在原始图象中嵌入秘密信息一水印来达到证实该数据的目的。不可见水印是目前图象水印的主要研究内容。具体分类如图1—5所示。数字水印稳健水印易损水印公开水印私有水印广_可见水印图象水印—一隐形水印语音水印视频水印网格水印文本水印其它图l一5:数字水印分类1.6信息隐藏与信息加密技术的区别信息加密与信息隐藏是数字信息安全的二种主要技术。经典的以密码学为基础的信息加密技术,是以往主要的信息安全手段,在许多应用场合,今后仍将发挥重要的作用。但传统的加密系统存在如下问题:保护机密信息时易遭受攻击(破译)。信息隐藏是近年来多媒体信号处理领域提出的一种解决媒体信息安全的新方法。它通过把秘密信息永久性地隐藏在可公开的媒体信息里,达到证实该媒体信息的所有权归属和数据完整性或传递秘密信息的目的,从而为数字信息的安全问题提供一种新的解决方法。信息加密与信息隐藏都是为了保护信息的使用和秘密信息的传输安全,但二者之间在保护手段上存在明显的区别。信息加密是利用密钥把信息变换成密文,通过公开信道送到接收者手中。加密信息在10 第1章信息加密与信息隐藏技术使用时,没有密钥的非法用户无法进行解密,从而无法J下确使用信息。而信息隐臧则不同,它作为信息加密的补充办法,主要目的并不是限制对信息的访问,而是确保宿主信息中隐藏的秘密信息不被改变或消除,从而在必要时提供有效的证明信息。在保密通信中,信息加密利用密码把明文变换为密文,然后送到公开信道,攻击者截获到的是一堆乱码。由于没有合法密钥而无法进行正常解密,只有通过已有的密码分析方法进行破译‘”】。因此,信息加密试图隐减秘密信息的内容,但未隐藏其存在。与此不同,信息隐藏技术更进一步,用于保密通信时,主要靠信息伪装掩盖通信存在的事实。它通过把秘密信息隐藏于可阻公开的信息中,使攻击者难以知道秘密信息的存在。因此,通讯安全的研究不仅包括密码术的研究,还包括信道安全的研究,其实质就是隐藏信息的存在。与密码术保护消息内容的目的不同,信息隐藏是为了隐蔽消息存在的事实或消息存在的位置,即将重要信息隐藏在其他信息之中,使得人们觉察不到他的存在,或者知道它的存在,未经授权无法确定他的位置。1.7本课题的研究目标通过以上的比较可知,传统的保密通信系统和传统基于隐写的通信系统都存在致命的缺点:保密信息经过加密变换后具有很强的抗攻击能力,但暴露了信息自身的存在;传统隐写术虽然具有很强的伪装性,其隐写机理一旦被发现,毫无保密可言,不具备任何抗攻击的能力。现代信息隐藏技术可以理解为数字信息上的隐写和物理隐写方法的数字仿真。其基本原理是利用人的听/视觉系统分辨率的限制形成图象、语音、视频信号较大的感觉冗余,因而提供了较大的信息隐藏空间(payload)。以数字媒体信息为载体,将有意义信息隐藏于其中,从而掩盖秘密信息的存在。因此说现代信息隐藏技术具有很强的伪装性,使用不可察觉性较强的水印嵌入策略很难判断传输的媒体数据中是否嵌入了秘密的信息,密秘信息在传输过程中不容易被识别、攻击、和获取。即使被发现,攻击方在不知水印嵌入策略的情况下很 第1章信息加密与信息隐藏技术难提取到载体中嵌入的信息。因此说现代信息隐藏信息技术具有传统保密通信和隐写术无法比拟的优点。通信模式如图l一6所示。图l一7:基于数字水印的隐秘传输系统本文研究目标就是要克服传统保密通信(加密解密技术和隐写术)所存在的缺点,构建一个安全、可靠、快捷(实时)、使用的信息隐藏传输系统。1.8论文的结构安排第二章对信息隐藏传输系统的中涉及的关键技术进行深入的研究和阐述。包括语音的采集播放;语音的压缩解压;水印的嵌入提取:语音的传输网络。第三章提出了音频信息隐藏传输系统的总体设计目标、思路、及要求。第四章提出了一个基于PSTN网的信息隐藏传输系统的设计思想,并就系统在实现中所需解决的问题和相关的技术细节做了深入的剖析。第五章提出了一个基于IP网的信息隐藏传输系统的设计思想,并就口网语音传输Qos的控制做了深入的研究。第六章对在本课题中完成的工作作一总结并就尚需进一步研究的工作作一12 第2章语音信息隐藏传输系统得总体设训第2章语音信息隐藏传输系统总体设计本章首先介绍了选择语音作为信息隐藏载体的原因,然后阐述了语音信息隐藏系统的设计目标、思路及要求。2.1选择语音作为信息隐藏载体的原因信息隐藏的载体包括语音,图象,视频、文本等数字媒体信号。之所以选择语音作为隐藏信息的载体是由于语音的数学模型可虬描述为关于时间的一维函数,在进行信息嵌入时可以减少运算复杂度和时间复杂度。而图象和文本的数学模型是二维函数.视频的数学模型是在图象基础上增加了时间轴的三维函数,因此在相同的嵌入方法和信息嵌入量的情况下,利用图象、视频进行信息嵌入的运算复杂度和时间复杂度远高于语音。相对与图象、视频、文本等其他媒体而言,语音是人们交流信息的普遍的方式,因此语音的传输一直是普遍关注的重点,随着PSTN网和Intcrnct的不断普及,语音的传输已经遍布到全球的各个角落。尤其是以软交换(soitswitch)思想为基础的下一代网络(NGN)的发展,能够做到不同网间信令和数据格式的转换,达到多网合一,这样使得不同网络用户之间进行语音传输成为可能,目前的PSTN网,Internet,无线网络的用户可以随时随地用语音来传输信息而无任何的障碍。这些发展使语音的传输更加的便捷,也为隐藏信息的发展成为可能。语音传输不同与其他媒体传输的一个重要特点是交互性,这使得语音传输系统是双工和满足实时性的。就语音传输的实时性而言,要比图象和视频的传输高的多,这为隐藏信息传输的快捷性成为了可能。基于上述的原因我们选择语音作为信息隐藏的载体,利用现有的PSTN网、Internet、和无线网络使得隐藏信息可以快速高效的传输到全球的各个角落。13 茆2章语音信息媳藏传输系统得总体设t2.2语音信息隐藏传输系统的设计目标系统的设计目标是以语音为载体,利用语音的冗余特性在其中嵌入隐藏信息。然后利用现有的语音传输网络(PSTN和Internet)将隐藏有信息的实时语音传输到目的地。然后提取信息并播放实时语音地系统。该系统能具有较强的伪装性和抗攻击能力,能克服传统保密通信(加密解密技术和隐写术)所存在的缺点。2.3语音信息隐藏传输系统的设计思路首先对语音信号进行实时的采集,然后按一定的嵌入策略在采集的语音数据中嵌八需要传输的保密信息和定位信息,之后再压缩打包经过信道传输,发送嵌有信息的实时语音数据流。接收方接收到语音数据流后先检测检测同步信息以便确定水印嵌入运算的起始位,然后提取嵌入在语音数据中的信息,最后将数字语音转换成模拟语音信号播放。系统的整体设计思路如图2一l所示:图2—1:系统的整体设计思路为满足语音传输的实时性,信道的传输速率必须满足一定的要求,如果每秒钟语音数据的采集量大于信道的传输速率,则必须在发送之前对数据进行压缩。2.4语音信息隐藏传输系统的设计要求由于系统是在传输数字语音的同时要完整的传输嵌入的信息,系统在设计时需具备如下特性:14 雨2荤语爵信惑酪黻传话系统得总体设计1.信息的嵌入策略必须具备不可察觉性:要提高系统的伪装性,就必须保证人耳听觉特性无法识别嵌入水印信息水印数粥与原始语音数粥的不耀。2.信息嵌入要满足较低的运算复杂度和时间复杂度:水印信息的嵌入处理需要鬏耧一定毂时润,为躐少语音黄辕稳延时,霆诧东印熬嵌入簿法要考虑尽可能降低处理的时间。3.承印的嵌入策鸥岿须具备鞍强的镶棒性:语音髂怠是在干扰信邋中传输的,嵌入在语音数据中的保密信息要完整的传送到接收方就必须有较强的抗噪声、抗干扰、抗压缩、抗攻击的能力。4。传输信道必须具餐差错羹传和纠锚功能:这是满足信息完整传浚的需嚣,但不是所有的传输信道都能满足。5。较强鳕搿步售患嵌入策蹬:接收方要能趱取塞售怠裁必须准确懿捡测鹭同步信息,由于传输信邋是干扰信道,同步信息的嵌入策略必须满足比薅藏落意嵌A繁臻更强弱罄捧鬯接觳方熬准确翡捡涮窭掰步薅惑。15 第3章实时语音信息隐藏传输系统的关键技术第3章实时语音信息隐藏传输系统的关键技术本章对实时语音信.包隐藏传输系统涉及的关键技术进行了深入的剖析,它包括语音的采集播放;语音的压缩解压;语音中信息的嵌入和提取技术;语音的传输技术:3.1语音的基本概念语音是音频信号的一种【9”,是携带信息的极其重要的媒体,是多媒体技术研究的一个重要内容。音频信号的种类繁多,如人的话音,乐器声,动物发出的声音,机器发出的声音以及自然界的雷声,风声,雨声等。声音是通过空气传播的一种连续的波。声音的强弱表现在声波压力的大小上,音调的高低体现在声音的频率上。声音用电信号表示时,信号在时间和幅度上都是连续的模拟信号。对声音的分析表明,声音信号是由许多频率不同的信号组成,这类信号称作复合信号,而单一频率信号称作分量信号。声音信号的一个重要参数是带宽,他用来描述组成复合信号的频率范围。如高保真音响信号的频率范围是lOHz_一20000Hz,它的带宽是20kHz。声音信号的两个基本参数是频率和幅度。信号的频率是信号每秒钟变化的次数,单位是Hz。对于频率在几Hz到20Hz的空气压力信号,人们也听不到,如果他的强度足够大,也许可以感觉到。人们把频率小于20Hz的信号称为亚音信号或称作次音信号:频率范围在20Hz一--20kHz的信号称为音频信号;虽然人的发音器官发出的声音的频率范围是80----3400Hz,但人说话的信号频率通常为300----30000Hz。人们把这种频率范围的信号称为话音信号或语音信号。高于20kHz的信号称为超音频信号或超声波信号。人们能否听到音频信号,主要取决于个人的年龄和耳朵的特性。一般说来人的听觉器官所能感觉的声音频率大约在20----20000Hz之间,17 蘩3章实}l寸语音信怒瓷藏传输系统霸关键菝幂3。2语音盼采集释撵鼓开发一个其有稳当精度,且凡乎不受琢装变纯影韵静投jj;i信号处理单元帮件是相当困难的【9”,而且成本也很高。如果把模拟信号转变成数字信号,那么难点就发生了转移。在数字域而不并模叛域巾作信号处理有许多优点。首先,数字信号计算是一种糖确的运算方法,它也不受时闽和环境的影响:其次,表示部件功能的数学运算不是物理上实现的功能部件,而是仅用数学运算去模拟,其中鲍数学运算瞧相对容易实我;、此势,可以对数学运算部件避行编程,如欲改变算法成改变某些功能.还可对数字部件进行再编程。3.2.1语音采集播放的概念和保存格式语音进入计算祝的第一步就是数字化,数字化实际就是采样和羹化。如前所述,连续时间的离散化通过采样来实现,戟是每嚼相等的一小段时间采样一次,这种采样称为均匀量化;连续幅度的离散化通过量化采实现.就是把信号躲强发划分或一小段一小段,如旗度的划分怒等闻璇戆,裁髂蔻线蠛量让,霉则就成为非线性量化。声音数字化应该回答两个问题;每秒钟需要采集多少个声音撵本,鼯采撵鬏率是多少,每谴声音样本瓣氆数是多少,也载是量纯精度。采样频率由采样定理给出,即采样频率困该大于原始信号极限频率的两倍。群本大,j、建每个净音样本的位数biffs鄂bps表示,反浚的是声瞽波形耩度的精度。样本比特数的大小影响到声啬的质嫩,位数越多,声音的质量越高,但需蘩存贮的空间也越多;位数越少,声音的质量越低,需要存储的空滴越少。声音通邀的个数称为声道数,是指一次聚样所记录产生的声音波形个数。拯莱怒擎声遂,受1只产生~令蔽声啻波形,翔鬃是袋声道,则产生蘧令声啻波形。立体声不仅音质好,而且具有空间感,但需要双倍的存储空间。滚形音频静禧式为多豢体瓷源交互文{孛格式,麓称为RIFF格式。RIFF捂式是多媒体文件的一种封装格式,对该文件的读取需舞特殊的函数。每个RIFF文件都有相似的结构,其基本构建为块,这种被称为RIFF的文释格式是可扩震接式的例子,是一种标记文件格式,在这秘格式下,文件由数据块缎成,而这18 筇3章实时语音信息隐藏传输系统的关键技术些数据块则由前面4个字符的ASCll名称和4字节的块大小来确认,块值的大小不包括块的名称和大小所需要的8字节。具体的字段的名称、长度、位置的定义如表2—1所述:表3-1RIFF文件头宇段的定义描述偏移地址字节数数据类型内容fccID00H4Char“RIFF”dwSize04H4Longint从08H到文件尾的字节数fccType08H4Char“WAVE”fccIDCH4Char“fmt”dwSize10H4Longint文件大小(PCM)10HwFormatTag14H2Int保留位,为1wChannels16H2Int声道数dwSamplesPerSec18H4Longint采样率dwAvgByetsPerSec1CH4Longint每秒平均数wBlockAlign20H2Int采样数8或16iBitsPerSarnple22H2Int数据块存放字节数fccID24H4Cbar‘‘data”dwSize28H4Longint采数据总字节数bypData2CHXShoItint采样数据3.2.2语音采集播放采用的途径语音采集常采用高级音频函数和低级音频函数两种方式,高级音频函数包括以下几类:1.MessageBeep函数:是一种基本的播放音频的方式。采用该函数播放波形音频形式上很简单,调用起来比较方便,但该函数只能调用系统规定的波形音频文件,这也就决定了该函数使用的局限性。2.P1aySound函数:可以播放应用程序,资源或系统事件所指定的声音文件必须为在win.ini文件有定义或已经被注册的波形文件。19 第3章实时语音信息隐藏传输系统的关键拄术3.使用DirectSound接口函数:DirectSoundAPI可以直接访问计算机上的声卡硬件,并可以根据波形缓冲器中的内容生成相应的声音。该缓冲器只是一块内存空间,可供声卡硬件直接读取,并转换成声音。通过设置缓冲器的值就可以产生一种纯正音调的声音,修改缓冲器的各个部分的数据的波形幅度就可以调制波形,产生各种声音效果。DirectSound可以实现八个或八个以上WAV文件的播放,能使多媒体程序更加生动,而且简单易用,但它仅适合于windows95下的程序。4.采用多媒体控制接口MCI函数:MCI函数向windows程序提供了高层次上控制设备接口的能力,程序不需关心具体设备就可以对其进行控制。采用高级音频函数可以在完全不和底层设备信令交互的情况下工作,这样带来许多编程上的便利,但是,该优点也是其缺点,如仅停留在调用封装得非常好得高级函数上,所设计出一个媒体软件效率也会降低。Windows提供得低级音频函数Wave,允许用户直接与音频设备驱动程序打交道,直接控制音频设备。3.3语音的压缩和解压未经压缩的数字语音数据量很大,不便于存储和传输,因此,模拟语音在采样量化后,要先经过压缩,再进行其他的处理。3.3.1语音压缩的概念和机理语音压缩的目的就是降低语音码流的比特率,减少语音传输的数据量。其主要属性有比特率、时延、复杂度和话音质量,在实际中往往根据应用情况,对各个属性提出折中的要求来确定合适的编码方法。语音压缩的机理就是利用语音信号自身的相关性,去处冗余,从而达到压缩的目的。每个人在说话时,肺部中的受压空气沿着声道通过声门时就产生了语音,普通男人的声道从声门到嘴的平均长度约为17cmⅢJ,这个事实反映在声音信号中就相当于1ms数量级内数据具有相关性,这种相关叫做短期相关。声道也被认为是一个滤波器,这个滤波器有许多共振峰,这些共振峰的频率随时间的变化的声道形状所控制,例如舌的移动就会改变声道的形状。许多话音编码器20 第3章实时语音信息隐藏传输系统的关键技术用一个短期滤波器来模拟声道。但由于声道形状的变化比较慢,模拟滤波器的传递函数的修改不需要那么频繁,典型值在20ms左右。压缩空气通过声门激励声道滤波器,根据激励方式不同,发出的话音分成三种类型:浊音(voicesounds),清音(unvoicesounds),和爆破音(plosivesounds)。浊音是一种准周期脉冲激励所发出的音,这种准周期脉冲是在声门打开然后关闭时中断肺部到声道的气流所产生的脉冲。声门打开和关闭的速率呈现为音节的大小,他的速率可通过改变声道的形状和空气的压力来调整。浊音表现在音节上有周期性,其值在2一一20ms之间,这个周期性称为长周期性。清音是由于不稳定气流激励所产生的,这种气流是在声门处于打开状态下强制空气在声道里高速收缩产生的。爆破音是在声道关闭之后产生的压缩空气然后打开声道所发出的音。某些音不能归属于上述三种音中的任何一种例如在声门震动和声道收缩同时出现的情况下产生的磨擦音,这种声音称为混合音。虽然各种各样的话音都有可能产生,但声道的形状和声道激励方式的变化相对比较慢,因此话音在短时周期里可以认定是准定态的,也就是说基本不变的。语音信号显示出的高度周期性,这是由于声门的准周期性的振动和声道的谐振所引起的。话音编码器就是企图揭示这种周期性,目的是为了减少数据率而有尽可能的不牺牲声音的质量。3.3.2语音压缩的主要算法语音编码器主要分为两种类型:波形编码器和参数编码器。波形编码就是根据话音的信号波形导出相应的数字编码形式,让解码器在接收端能恢复出与输入信号波形相一致的原始语音。波形编码器的基本思路是忠实的再现话音的时域波形,为了降低比特率,充分利用相邻抽样点之间的消息冗余性,对差分信号进行编码。波形编码的方法简单,但码率高,当码率低于32kbps的时候音质明显降低。著名的波形编码标准有G.711(64kbpsPCM脉冲编码调制)和G.726(16/24/32kbpsADPCM自适应差分脉冲编码调制)。2l 帮3章实时语音信息隐藏传输系统的关键技术参数编码器的原理和设计思想和波形编码器完全不同。它根掘对人的发声机理的分析,着眼于构造话音生成模型,该模型以一定的精度模拟发话者的发声声道,接收端根据该模型还原生成发话者的音素。编码器发送的主要信息是话音生成模型的参数,相当于话音的主要特征,而并j#话音的波形幅值。参数编码器可以有效的降低编码比特率,目前小于16kbps的低比特率话音编码都采用参数编码。VOIP常用的参数编码标准有G.723.1(5.3/6.4kbps)、G.729和G,729A(8kbps)。G.711、G.726、G.723.1、G.729年[1G.729A的部分性能比较如表2—2所示:表3—2常用语音压缩算法部分性能比较编码方法G.711G.726G.723.1G.729G.729ACS—编码类型PCMAD—PCMMP—LPCACELPAcELP话音质量(MOS)4.13.853.93.653.923.7比特率(kbps)64166.45.38处理器能力复>O.5214.61620lO.5(MIPS)杂存储器大小度>100220027002000(字节)帧长度(ms)0.12530mslOms1{)ms延前视时延迟O07.5ms5ms(ms)帧字节数242010表3—2中的语音质量是在理想情况下的比较,实际上,不同的编码方法在语音质量上的性能,在不同的具体条件(如背景噪声、多重编码、丢帧影响)下有不同的表现。 笫3章实时语音信息隐藏传输系统的关键技术l、在噪声环境中,G.723.1、G.729等参数编码器的表现不如波形编码器G.726;因为背景噪声违背了参数编码器的话音生成模型的假设,而波形编码器却不受影响。2、G.723.1、G.729等低速率编码方法在多重编码条件下很难保证话音质量。因此在需要三重或多重编码的实际应用环境中,只能选择G.726或G.711。3、突发丢帧对语音质量的损害很大,特别是在每个IP分组封装了多个语音编码帧时,每个丢失分组导致大量的突发丢帧,将使语音质量降低到无法接受的程度。图3一l显示了在不同背景噪声和帧丢失条件对G.729编码语音质量的影响,说明输入信号背景噪声对G.729的影响非常大,而帧丢失也将导致语音质量下降。在实际应用中,不能改变背景噪声量,但是可以通过管理网络,提高QOS.维持低等级的帧丢失率,从而保证语音质量。图3—1不同背景噪声和帧丢失条件对的G.729编码语音质量的影响3.3.3静音压缩技术一般说来,人们在进行电话交谈时,50%为聆听对方讲话的静默时间,10%为讲话时短暂停顿的静默时间。因此在一路全双工电话交谈中,只有40%左右的信号时段是有效的,也就是话音的活动度大约只有40%左右。静音压缩技术就是通过检测通话过程中的静默时段,并在这些静默时段停止发送语音分组,从而进一步降低话音比特率。 蒴3章实时语音信息隐藏传输系统的关键技术静音压缩技术的关键是静音检测,即如何判断出说话者处于不发声状态,又称为话音活动性检测(VAD)。静音检测有两个技术难点。其一是如何在噪声较大的环境中检测静音;其二是剪音问题。因为静音检测的判断门限,使晚话者从说话到静默及从静默到说话的过程中的一段微弱话音部分可能被作为静默而丢弃了。实用的静音压缩算法在语音静默期间采用非常低比特率进行编码或者不发送任何比特,并且在接收方采用舒适噪声生成技术重构背景噪声的主要特征,使得复原的话音的有音段和无音段之间有平滑的过渡。解决剪音问题的方法是在一组突发话音分组之前和之后分别增加一个话音分组进行平滑。3.3.4回声消除技术当IP电话系统与PSTN互连时,涉及到有混合线圈的2/4线转换电路,就会产生回声。当回声返回时间超过10毫秒时,人耳就可听到明显的回声了,干扰正常通话。对于时延相对较大的IP网络环境,时延很容易就达到50毫秒,因此必须应用回声消除技术清除回声。回声消除主要采用回波抵消方法。即通过自适应方法估计回波信号的大小,然后在接收信号中减去此估计值以抵消回波。回波抵消功能一般由网关完成。3.4语音中信息的隐藏和提取方法目前国内外的音频信息隐藏算法可以分为压缩域和非压缩域算法。但大多数的研究都集中在非压缩域算法。而非压缩域的方法又可分为时域的方法和变换域方法。时域算法的特点是计算复杂度低,嵌入的信息量大,但稳定性较差。变换域算法通过改变音频信号的频域系数(如I)CT、DFT或DWT系数)来隐藏信息,虽然在一定程度上提高了算法复杂性,但通常具有较好的鲁棒性。现在国内外的趋势都是倾向于频域算法的研究开发。 第3章实时语音信息隐藏传输系统的关键技术3.4.1人类听觉系统(HAS)要研究音频水印对HAS(HumanAuditorySystem)人类听觉系统的特点和声音的物理特性要有所了解。人耳能感受到的声音频率范围约为20到20000HZ,另外人耳对频率高低的感觉与实际频率的高低也不成线性关系,而是近似为对数关系。人耳对于频率的分辨能力也是非均匀的,另外人耳对频率的分辨能力也受声强的影响,过强或过弱的声音都会降低分辨的敏感性。另外相对于人类视觉系统(HVS)来说,人类听觉系统要灵敏得多。在特定条件下人耳对两个不同音的分辨间隔可以达到2ms,这使得音频水印的研究具有更大的挑战性。人类听觉系统也有其特有的性质,下面列出一些比较重要的听觉特性:1)对听觉系统和对声音绝对相位的不敏感性和对相对相位的敏感性。这一特性在相位编码技术中得到了充分的应用。2)掩蔽效应是指使一个声音A能感知的闽值因另一个声音B的出现而提高的现象,这时B叫掩蔽声,A叫被掩蔽声。具体的又可以分为纯音的掩蔽、复音的掩蔽、噪声的掩蔽等等。3)哈斯(Hass)效应是指人们不能分辨某些延迟声的现象,实验表明如果延迟声的声压小于先导声,则只要延迟声迟于先导声的时间小于17ms,就不会被人耳感知到。3.4.2空域信息隐藏方法1.替换LSB(LeastSignificantBits)位法:由于语音通常都存在一定的噪声,对LSB的变化可以为噪声所掩盖,这是替换LSB来隐藏信息的依据。改变LSB主要的考虑是不重要数据的调整对原始语音的听觉效果影响较小。在该方法中,语音部分数据(载体数据)的最低一个或多个位平面的值被隐藏数据所替换。即载体数据的LSB平面先被设置为0,然后根据要隐藏的数据改变为“1”或不变,以此达到隐藏数据的目的。方法可以描述如下:令撕,五,⋯,五)为从原始宿主语音中选择来作为隐藏信息的载体数据集合,(bl,b2,⋯,6。;玩∈{O,l}}为待隐藏的信息,则嵌入过程为:c。f正)+_也(3.1) 笫3章实时语音信息隐藏传输系统的关键技术其中算子c‘f}耿载体数据的最低1位。上述替换过程也可以扩展到替换载体数掘的虽低口位:c。9∽}}%,b,p。⋯,6(。),(3.2)检测隐藏数据时,根据替换的位数,从载体数据中抽取LSB.然后依据替换的顺序进行排列,就得到隐藏数据。替换LSB的隐减方法需要解决二个问题:1、载体数据的选择。载体数据的选择考虑隐藏数据的秘密性。在最简单的情况下,可以选择语音的所有样本来隐藏数据,载体数据从语音的第一个数据开始。当然,这种选择方式秘密性不强。更好的办法是采用~个密钥控制一个随机序列来选择载体数据。通信双方使用一个事先约定的密钥k来生成一个长度为一的随机数序列f而,恕,⋯,k),于是语音样本集合{^,^^,⋯,^Ⅳ,.+‘)被选择作为载体数据a换言之,隐藏信息的嵌入位置是随机选择的。这种方法称为随机间隔法,具有较好的秘密性。由于被修改的样本和没有修改的样本集合之间的划分没有规律,它的另一个优点是难以用统计的方法来判断一段语音是否隐藏优信息。为了利用HAS的特性,较少LSB替换对不可感知性的影响,载体数据也可以根据局部邻域的情况自适应选择。2、LSB替换。替换要考虑的问题包括:替换几位?替换哪些位?替换几位是由载体数据集合的大小和隐藏信息的数据量决定的.但需要满足不可感知性的限制。此外,当替换多于1bit时,利用统计的方法检测隐藏数据的可能性将提高。换言之,信息伪装的作用将随着降低。通常,空域里的替换应限制在3bits内。替换载体象素哪些位,将影响到隐藏信息的稳健性和掩密语音的保真度。替换位数越高,对抗加性噪声的稳健性越好,但掩密语音失真越大;反之亦然。2.扩展频谱方法(0SSS):把秘密信息通过扩频分散到尽可能多的频谱中,以随机噪声的形式叠加到语音数据中,以达到隐藏数据的目的。扩展频谱的方法很多,常用的由直接扩频编码方法(DirectSequenceSpreadSDrecru[[【Encodeing即DSSS)。DSSS算法中需要用一个密钥来编码和用相同的密钥来解码。该密钥是伪随机噪声,理想伪随机噪声是白噪声,它在频率范围内有良好的频率相应。密钥用来编制信息.把序列调整成扩频序列。 第3章实时语音信息隐藏传输系统的关键技术密码数据被载波和伪随机序列所放大,后者有很宽的频谱。结果,数据的频谱被扩散到可能的波段之中。然后,扩展后的数据序列被弱化,并作为加性随机噪声叠加到语音源文件中。试验表明,该方法对MP3音频编码,PCM量化和附加噪声有一定的鲁棒性。Boney等人提出了一个使用与音频水印的扩频方法。他们选用的是一个伪随机序列,且为了利用HAS的长期或短期掩蔽效应,对该序列进行若干级滤波。为利用HAS的长期效应,对每一个512点采样的重叠块计算它的掩蔽同值,并近似的采用一个10阶的全极点滤波器,对刚序列进行滤波。利用短期掩蔽效应,根据信号相应的时变能量,对滤波后的刚序列进行加权处理。这样在音频信号能量低的地方可消弱水印。另外,水印还要经过低通滤波,即用完全音频压缩和解压缩实现低通滤波,以保证水印可以抵抗音频压缩。嵌入到语音的高频部分,可使水印更好的从未经压缩的音频片断中检测出来,但压缩过程会将它除掉。作者用“低频水印”和“误码水印”来表示水印的两个空间成分。利用原始信息和PN序列,采用相关性方法,则可通过假设检验将水印提取出来。3.相位编码方法:利用人耳对绝对相位的不敏感性和相对相位的敏感性来将秘密数据位的参考相位替换原语音段的绝对相位.并对其他的语音段进行调整,以保持各段之间的相对相位不变。当代表秘密数据的参考相位急剧变换时,会出现明显的相位离差,它不仅会影响隐秘信息的隐秘性,还会增加接收方译码的难度。造成相位离差的一个原因是用参考相位代替原始相位而带来了变形,另一个原因是对原始语音信号的相位改动频率太快,因此尽量使转换平缓咀减少相位离差带来的语音变形。为了使变换平缓,数据点之问就必须留下一定的距离,而这种做法导致的影响是降低了语音嵌入的位率,另一方面,为了增强编码的抗干扰能力,应将参考相位之间的差异最大化,因此,将选用“一石/2”代替⋯0,用州2“州2”代替“1”。为了使相位离差的影响得咀改善,需要在数据转换点之间留有一定的间隔来使转换变得平缓,但他的缺点是减小了带宽。因此必须在数据的潜入量和嵌入效果之间取一折中。一般说来,相位编码的信道容量为8bps到32bps。当载27 第3章实时语音信息隐藏传输系统的关键控术体信号是较为安静的环境,则潜入量更小,一般只可得到8bps的信道能力,当载体信号是较为嘈杂的环境,可增大嵌入量,得到32bps的信道能力。4.回声隐藏编码法:是通过引入回声来将秘密数据嵌入到载体数据中。它利用人类听觉系统的另一特性:声音信号在时域的后屏蔽作用,即弱信号在强信号消失之后变得无法听见。它可以在强信号消失50—200ms作用而不被人耳察觉。载体数据和经过回声隐藏的隐秘数据对于人耳来浣,前者就像是从耳机里听到的声音,没有回声。而后者就像是从扬声器里听到的声音,由所处空间如墙壁,家具等物体产生的回声。因此,回声隐藏与其他方法不同,它不是将密码数据当作随机噪声嵌入到载体数据中,而是作为载体数据的环境条件,因此对一些有损压缩的算法具有一定的鲁棒性。引入回声将秘密数据嵌入到载体信中。3.4.3变换域信息隐藏方法另一类信息隐藏算法是在变换域中实现的。借助信号进行正交变换后能量重新分布的特点,在变换域中进行信息隐藏,可以较好地解决不可感知性和稳健性的矛盾。因而,基于变换域的方法在信息隐藏研究中占据主流位置。正交变换可以理解为将信号按频谱进行分解,每个分量的值代表信号再此频率上的能量:反变换则是一个对各频率分量进行加权和的合成过程。经过变换后,信号能量的分布与时域/空域不同。通常,信号口j主要能量集中在低频成分,因而变换域低频系数的值普遍较大;而高频系数则表示信号的突变成分,相对来说,其值较小。信息隐藏中主要应用的变换包括:DFT(DiscreteFourierTransform)、DCT(DiscreteCosineTransform)YODWT(DiscreteWaveletTransform)等。设一维函数及变换系数为删、H∞,则一维正交变换的正变换和逆变换定义为卜卜7V“"2彩扛卜皿刑’.。鼠。讲1(3.3)1厂(x)=,7-t{F(“))=∑,(x)-占(训)其中一k“)和曰““)称为正变换核核反变换核。 第3苹实时语音信息隐藏传输系统的关键技术】.傅利叶变换(DFT):一维DFT的正变换和逆变换定义为:f1M一‘P)-引八曲卜者互,(抽“-j2a'uxlM],o氟.。瓤1B4)【f(x)_罗。扩m”2击善凡Ⅳ)exp[j2mo:/M】作为传统的数字信号处理工具,DFT很早就被应用到了音频信息隐藏的研究中,也有较多的成果。Bender等。=。3提出著名的相位编码技术,它是基于DFT变换的,充分利用了HAS的特性——人耳对绝对相位的不敏感性和对相对相位的敏感性。基于这个特性,用代表秘密数据位的参考相位替换原音频段的绝对相位,并对其它音频段进行调整,以保持各段之间的相对相位不变。Shyh等““采用了一种改进后的相位编码方法,利用重叠分段技术(overlappingwindows)的方法提高嵌入的容量与减少分块引起的边界效应。并将相邻块的相位改变限制在30度之内以提高隐减信息的不可察觉性。DFT变换系数的幅值也可以用来隐藏信息,在不同的频段都有人进行了尝试。John“”等将隐藏信息嵌入到了OFT系数的中频带(2.4kHz’6.4kHz)中。文献m1中则将信息嵌入到了高频(>6.5kHz)中,但处于高频段的隐藏信息很容易被简单的滤波攻击所破坏。~个新的研究思路是:结合幅度和相应两者来携带信息,类似于通信原理中的正交幅度调制(qAM)技术,充分利用频域的结构。Cooperman等‘561把音频信号分为不重叠的块后,将隐藏信息嵌AN每块音频FFT变换后的LSB位上,DICE公司还开发了一个基于该算法的信息隐藏软件。而Michael等【m则使用了另外一种嵌入技术,他们使用‘1010⋯10’和‘0101⋯01,两个不同的模式来替换DFT系数的低位。其中‘1010⋯10’代表‘1’:而‘0101⋯01’代表‘0’。Shin等傅利叶变换的改进形式一一具有一定局部化的短时傅利叶变换(STFT),将隐藏信息嵌AN变换域的中低频(3kHz’4.0kHz)中,并使用了Turbo码来降低隐藏信息的误码率。San等尝试了在复时谱(ComplexCepstrum)的中使用公式c(n)2C(n)+a}w(n)来嵌入隐藏信息。并用这种方法来测试多重隐藏信息,取得了不错的效果,不过隐藏信息的类型仅仅是lbit的多重隐藏信息。 第3章实时语音信息隐减传输系统的关键技术2.离散余弦变(DCT):一维DCT的正变换和逆变换定义为F“)f(x)I赤三八功},⋯臣Z:。s(x)cos%竽击脚岳》灿s警“=0“=l“2..,M一1(3.5)x=0,1,-一,M一1作为与DFT地位相似的DCT变换,在图象压缩标准JEPG与视频压缩标准MPEGl、MPEG2中得到了广泛的应用,在图像和视频信息隐藏中人们也使用DCT变换进行了大量的研究。DCT变换在音频信息隐藏中也有应用,如Huang等在音频时域中使用了13位的bark码作为同步信号来定位隐藏信息,而将有意义的隐藏信息利用均匀量化的技术嵌入到音频段的DCT的低频系数中。由于隐藏信息被嵌入到了低频系数所有具有较强的抗攻击能力,但是时域中的同步信号却不具有和隐藏信息一样好的性能。Saito等则使用了改良的MDCT(ModifiedDiscreteCosineTransform)变换,在子带分解的最低频带中嵌入了直接序列扩频后的隐藏信息。3.小渡夏抉(DWT):小波变换的定义如下:把母函数x(O,矿(f)作位移r后,再在不同尺度a下与待分析信号/O)作内积:啊(町)=击e,(f旷(等瑚,删(36)等效的频域表示是:wT,@,r)=42玎ap(珊)甲‘(删)e+J。r抽(3·7)其中,(∞),甲(甜)分别是,(f),∥(f)的傅里叶变换。,。)=下1ZwT/(叩).矿(等j(3.8)-4a¨小波变换以其众多的优越性质和小波域信息隐藏技术日益受到重视。 第3章实时语音信息隐藏传输系统的关键技术Mohamed等通过冗余小换变换来求出音频中的跳跃点(sa]ientpoint),然后通过改变这些跳跃点之问的距离来表示不同的信息。这可以看成一种基于形态的信息隐藏技术。值得~提的是该算法可以抵抗0.9到1.1倍的拉伸攻击,然而一个致命的弱点是隐藏信息的容量太小了,仅为l2bits/s。3.5语音的传输语音其传输方式主要是利用现有的有线网络和无线网络。有线网络主要是PSTN网和Internet,无线网络主要是移动通信网。PSTN网的传输的是模拟语音,经过采集和信息嵌入的数字语音要经过A/D转换才能在PSTN网上传输,信息接收方再经过D/A转换才能提出嵌入的信息。因此语音的收发方就必须加一个调制解调器Modem来完成A/D和D/A的转换功能。目前的Internet网络基本采用的IP协议,也就是IP网络。语音的传输要遵循IP协议。由于IP网尽力向用户提供的是一个有限带宽、变动,时延,抖动,丢包率随时间变化的通道。这些变动并不能预先得知,因此口网上进行语音传输就必须传输质量控制。目前通用的方式是应用实时传输控制协议RTP,RTCP。3l 第4章基于PSTN网得信息隐藏系统得设计和实现第4章基于PSTN网的信息隐藏系统的设计与实现本章提出了一种基于PsTN网的信息隐藏系统传输系统,在传输实时语音数据的同时,能传输嵌八在其中的需保密信息,从而达到信息隐藏传输的目的。本章就该系统的设计思想,实现中需解决的问题、技术细节、和编程实现进行深八的剖析。4.1基于PSTN网的信息隐藏系统的设计思路和要求首先利用计算机的声卡对语音信号进行实时的采集并保存在内存中,然后按一定的嵌入策略在采集的语音数据中嵌入需要传输的保密信息和定位信息,之后再压缩打包经过信道传输(利用Modem的PSTN网)发送嵌有水印信息的实时数字语音数据流。接收方接收到语音数据流后先检测检测同步信息以便确定水印嵌入运算的起始位,然后提取嵌入在语音数据中的保密信息,最后将数字语音转换成模拟语音信号播放。为满足语音传输的实时性,信道的传输速率必须满足一定的要求,如果每秒钟语音数据的采集量大于信道的传输速率,则必须在发送之前对数据进行压缩。整个系统的工作流程如图4一l所示:图4—1:系统的整体设计思想4.2语音采集与播放的实现语音的采集就是把模拟的语音信号通过采样量化转换为数字的语音数据直接保存在内存中的过程。考虑到对声卡控制和操作的方便,本系统中语音的采集和播放应用Windows的底层API函数实现。采样频率根据需要可以选择833 第4章基于PSTN刚得信息隐藏系统得设计和实现KHZ,11.025KHz,22,05KHZ,44.1KH。每样本的量化位数可以是8或16。声道可为单声道或双声道。语音采样工作流程如图4--2所示:准备采样一开始采样+采样结束后,匝亟困块进一再近一还给采样设备采样一图4—2:语音采样工作流程采样前首先要打开采样设备设备(通过计算机声卡),获得采样设备旬柄,指定采样格式(采样频率,量化位数,),分配若干用于保存采样数据的内存,内存的大小和数量将进一步分析。开始时,先将所有内存块都提供给采样设各用来采样,采样设备就会依次将语音数据写入内存.当一块内存写满,采样设各就会发一个Window消息MMWIMDATA给相应的窗口,通知程序作相关的处理,这时程序通常的处理是把内存数据进行复制或相关的处理,在此我们的处理是把数据进行水印嵌入、压缩、和发送,然后把内存置空,返还给采样设备进行采样,这样就形成一个循环不息的采样过程。采样结束时就释放所有内存块,关闭采样设备。本系统考虑使用中11.025KHZ的采样频率,量化精度为8bits。4.3语音压缩与解压算法的选取及在系统中的实现系统中语音的采样率是11.025KHZ,量化精度是8bits,则每秒采集的数据量是88.2kbit,而Modem的最高传输速率只有56kbit,一般情况下都低于 第4章基于PSIlq网得信息隐藏系统得设计和实现38kbit.因此数据在传输之前必须进行压缩处理,而且压缩比大于5:1才能保证通信的畅通。本系统语音的压缩和解压算法采用windows的音频压缩管理器ACM所附带的编解码器来实现收发端对语音数据的压缩和解压,ACM带有许多语音的编解码器。如.GSM6.1、Truespeech、ADPCM、a—low、Ulow等压缩编码。其中Truespeech是参照ITU语音压缩标准G.729.1而制作的[93]。该编码方案的特点是分析窗采用混合窗;LSP参数采用二级矢量量化;以子帧为单位的码本搜索分为自适应码本搜索和代数码本搜索;基音分析采用开环基音分析和自适应码本搜索相结合,而降低了运算量,减少了基音的量化比特数,并提高了基音预测的准确度:代数码本算法简单,不需要存储码本,恢复音质清晰。在8Kb/s码率下合成音质不低于32kb/sADPCM的水平,算法延时15ms。适合于语音的实时传输,压缩比达到10:1。我们所要碰到的问题就是TrueSpeechCODEC不能处理11025Hz,8位.单声道的PCM数据。它只能处理8000Hz,16位,单声道的数据(某些情况下是8位)。因此我们必须先将源数据转换为TrueSpeechCODEC所支持的中间PCM格式,然后在使用它将中间数据转换为最终所需的格式。语音压缩的工作流程如图4—3所示:准备数据压缩通过枚举驱动查找指定压缩算法的驱动程序通过枚举查找支持PCbl对象的音频格式按照转换前后及中间的音频格式分配相应的内存空间开始压缩打开流对象并填充十衅}换信息l完成110255bytes}1]8000bytes的转换打开压缩驱动设备和流对象并填充{辞}换信息2开始压缩准备号的数据图4--3:语音压缩的工作流程35压缩结束压缩成功关闭流设备和驱动设备返回压缩后的数据返回压缩后的数据{}转换信息1:源数据地址大小,目标数据地址大小。}}转换信息2:中阃格式的数据地址太小,目标数据的地址大小。 第4章基于PSTN网得信息隐藏系统得设计和实壬见4.4信息嵌入和提取在系统中的实现4.4.1信息嵌入和提取算法的选取空域嵌入法是将待隐藏的水印信息替代载体信息中的冗余部分,空域信息隐藏技术的特点是方法较为简单,但鲁棒性较差,对媒体较小的抖动都可能导致整个信息的丢失。相对于空域法,变换域信息嵌入方法有许多优点:①嵌入信号的能量可以分布到空域的所有象素上,使不可觉察性加强:②人的听觉系统的掩蔽特性可以结合到编码中;③变换域的方法可与一些数据压缩标准兼容,如JPEG等。对压缩、裁减、和对图象处理的攻击的鲁棒性加强。变换域水印嵌入方法可以分为以下几类:(1):付氏变换域(DFT)方法,(2):离散余弦变换(DCT)方法,(3):小波变换域(DWT)方法。使用小波变换有以下几个优点:1.小波变换还具有时频局部性;2.小波变换具有更多的灵活性,选择不同的分解层数,分解层数越多,水印越鲁棒;3据需求选取最适合的小波基来嵌入水印;3.计算量小,设音频样本的长为N,DCT的计算量为0(N*N),则FFT的计算量为0(1092(N)十N),而小波变换的计算复杂度为0(L*N),其中L是小波基的长度是一常数。权衡各种嵌入策略的利弊,及本系统对嵌入水印的各种性能指标的要求,考虑应用离散小波变换法,将水印信息嵌入到变换后的低频系数中。4.4.2信息的嵌入和提取过程考虑到隐藏信息是要嵌入到载体中的字符串中,而字符串是以字节方式存储的,本文为待嵌入和检测的字符串设计了一个(‘8)形式的BCH码[991,其中r表示BCH码长。我们用一个具有256个BCH码字的信号集,品,0≤。c256,来表示一个字节的256个不同的值。待隐藏数据的每个字节磁,对应于信号集品中的一个原型信号,被影射到一个BCH码字:孵5硎Ccx“'nQx,L(0,1),0≤J
此文档下载收益归作者所有