资源描述:
《信息论基础——随机过程的信息度量和渐近等分性》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2.2随机过程的信息度量半可加数列及其性质平稳信源序列的熵率冗余度平稳信源序列的熵率的求解问题2.2随机过程的信息度量例1:一个马尔可夫过程的基本符号为0,1,2,这3个符号等概率出现,开且具有相同的转移概率。请画出一阶马尔可夫过程的状态图,并求稳定状态下的一阶马尔可夫信源熵和信源剩余度.解:一阶马尔可夫过程的状态转移图2.2随机过程的信息度量设状态的平稳分布为,根据一阶马尔科夫信源熵:信源冗余度:↙2.2随机过程的信息度量例2:一阶马尔可夫信源的状态转移图如下图所示,信源的符号集为(1)求平稳后的信源的概率
2、分布;(2)求信源熵解:设状态的平稳分布为根据:2.2随机过程的信息度量(2)2.3渐近等分性质渐近等分性(AEP)弱典型序列弱典型序列的数值实例2.3渐近等分性质渐近等分性(AEP)弱典型序列弱典型序列的数值实例2.3渐近等分性质是随机变量长序列的一种重要特性,是编码定理的理论基础,简称AEP。当随机变量的序列足够长时,其中一部分序列就显现出一种典型的性质:这些序列中各个符号的出现频数非常接近于各自的出现概率,而这些序列的概率则趋近于相等,且它们的和非常接近于1,这些序列就称为典型序列。其余的非典型序列的出
3、现概率之和接近于零。序列的长度越长,典型序列的总概率越接近于1,它的各个序列的出现概率越趋于相等。渐近等分性即因此得名。2.3渐近等分性质渐近等分性有许多不同的具体形式,但一般地可以表述如下:若X是一个符号表,共有M个不同的符号x1,x2,…,xM,它们的出现概率分别是p1,p2,…,pM。对X进行N次独立的选择,于是得到一个长度为N的符号序列;总共有MN个长度为N的不同序列。可以证明,对于给定的两个任意小的数ε>0和δ>0,一定可以找到一个正整数N0(它是X,ε和δ的某种函数),使所有长度为N≥N0的序列可
4、划分为以下两组:2.3渐近等分性质第一组包含Wε<MN个序列,其中各个序列都具有几乎相等的出现概率p,且有?实际上,当N充分大时,Wε=2NH,式中H是X的符号熵。第二组包含其余的MN-Wε个序列,它们的出现概率之和小于ε。显然第一组包含的是典型序列,第二组包含的是非典型序列。在各个符号的概率不相等的情况下,序列长度N越大,则Wε与MN的差别越大,而p·Wε与1的差别越小,-logp/N与H的差别也越小。2.3渐近等分性质渐近等分性的意义在于:对于任意取有限个值的随机变量X,当用N次独立选择的方法来形成编码序
5、列时,只要N取得足够大,就可以只考虑其中Wε个典型序列,而其余所有的非典型序列均可以忽略。2.3渐近等分性质信息论中,渐近等分性是弱大数定理的直接推论.大数定理指出:对于统计独立、有等同分布的随机变量,只要n足够大,就接近数学期望渐近等分性指,对于统计独立、有等同分布的随机变量,只要n足够大,联合概率就接近信源熵2.3渐近等分性质定理2.3.1对无记忆信源有以概率收敛到.其中,Xi是统计独立,且服从分布p(x);视为一个扩展信源简证:由于相互独立随机变量的函数也是随机变量及弱大数定理2.3渐近等分性质渐近等分
6、性(AEP)弱典型序列弱典型序列的数值实例2.3渐近等分性质定义2.3.1称满足性质的n长序列为弱典型序列,或-典型序列.记所有集为定义式等价于:2.3渐近等分性质利用AEP可得到弱典型序列的如下性质:定理2.3.2,当n足够大时,有(1)(2)2.3渐近等分性质渐近等分性(AEP)弱典型序列弱典型序列的数值实例2.3渐近等分性质2.3渐近等分性质2.2-2.3作业:P42:3),4)-(b)2.3渐近等分性质定义2.3.1称满足性质的n长序列为弱典型序列,或-典型序列.记所有集为定义式等价于:2.3渐近等分
7、性质利用AEP可得到弱典型序列的如下性质:定理2.3.2,当n足够大时,有(1)(2)2.3渐近等分性质弱典型序列集占n长序列Xn总数的比例:弱典型序列只占全体序列的一小部分!2.4渐近等分性在数据压缩中的应用2.4渐近等分性在数据压缩中的应用任何一个离散随机序列信源当序列长度n→∝时,信源序列会产生两极分化:大概率事件集合与小概率事件集合.由此可见,信源编码只需对信源中少数落入典型大概率事件的集合的符号进行编码即可;而对大多数属于非典型小概率事件集合中的信源符号无需编码.码字总数减少,所需码长可以减少2.4
8、渐近等分性在数据压缩中的应用记上述编码的误差概率为:由弱渐进等分性该编码的码率满足:误差概率:当n充分大时,码率接近H(X)!误差概率趋于0.信源编码正定理在该码率的任意邻域内存在符合某种条件的编码器与解码器2.5Shannon-McMillan-Breiman定理在《通信的数学理论》中,Shannon首先运用典型序列的思想给出了离散无记忆信源下的可达码率区间;而后,Shannon又进一步推广到有限