欢迎来到天天文库
浏览记录
ID:48432512
大小:396.79 KB
页数:17页
时间:2019-11-22
《第3章正态分布时的统计决策.docx》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第3章正态分布时的统计决策在统计决策理论中,涉及到类条件概率密度函数pm叫)。对许多实际的数据集,正态分布通常是合理的近似。如果在特征空间屮的某一类样本,较多地分布在这一类均值附近,远离均值点的样本比较少,此时用止态分布作为这一类的概率模型是合理的。另外,止态分布概率模型有许多好的性质,有利于作数学分析。概括起来就是:(1)物理上的合理性(2)数学上的简单性下面重点讨论正态分布分布及其性质,以及正态分布下的Bayes决策理论。3.1正态分布概率密度函数的定义及性质1.单变量正态分布(3.1-1)其中:“为随机变量x的期望,也就是平均值;;为X的方差,(7为均方差,又称
2、为标准差。(3.1-2)(3.1-3)概率密度函数的一般图形如下:p(x)具有一下性质:p{x)>0,(—83、值向量“是d维的。也就是:〃……〃广为d维均值向量。工是dxd维协方差矩阵,是工的逆矩阵,吃1为》的行列式。协方差矩阵工是对称的,其屮有dx(d+l)/2个独立元素。由于如)可由“和工完全确定,所以实际上poo可rhd+dx(d+i)/2个独立元素来确定。(兀-“)7是(X-“)的转置,且:^=E{x]Z=E{(x-//)U-A)r}肃是工的第i、j个元素。(3.1-6)“、工分别是向量X和矩阵(““)(“莎的期望。具体说:若兀是兀的第i个分量,M是〃的第i个分量,=E[Xj]=J%/p(x)dx=£°Xjp(Xj)dxj苴中/?(可)为边缘分布,p(x"=p-f°p4、(x)dx}dx2--dxdJ—ooJ—oo“对于二维随机变量X和Y作为一个整体,其分布函数F(x,y),而X和Y都是随机变量,各别也有分布函数Fx(x)、FY(y),分别称为二维随机变量(X,Y)关于X和Y的边缘分布函数。有:Fx(%)=F(x,+oo)和Fy(y)=尸(+汽y)。对于离散随机变量有:00你⑴二Fg+oo)=工工心从中得到X的分布律为:无Vx7=1P{X=兀}=£心同样,Y的分布律为P{Y=yj}=YPij0;=1/=i对于连续型随机变量(X,Y),假定它的概率密度为m,y),由:Fx(x)=F(x,+oo)=r[[7(%,y}dylx知道,X的概5、率密度为:J-ooJ-OO人⑴二匚/E)dy同样也可以求出Y的概率密度函数。”(3.1-7)而:冷=E[(可-角)(勺-“/)]=flIL(石一)(勺一“J)•Pg,Xj)dxidxj]协方差矩阵:(3.1-8)是一个对称矩阵,只考虑工为正左矩阵的情况,也就是I。所有的子式都大于Oo即1昂i>o,同单变量正态分布一样,多元正态分布°⑴可以由”和工完全确定,常记为。1.多元正态分布的性质(1)参数“和工对分布的决定性对丁维随机向量X,它的均值向量“也是d维的,协方差矩阵是对称的,其屮有d(d+l)/2个独立元素。p⑴可市〃和工完全确定,实际±p(x)可由d+d(d+l)6、/2个独立元素决定。常记为:p(x)〜N(“,》)。(1)等密度点的轨迹为一超椭球面rtipw的定义公式(3.1-5)可知,当右边指数项为常数时,密度爪)的值不变,所以等密度点满足:(%-A)7Z-1(%-//)=常数可以证明,上式的解是一个超椭球面,其主轴方向取决于艺的本征向量(特征向量),主轴的长度与相应的本征值成正比。如下图所示:O)心〉"=2〉;(b)等密度点轨迹从上图可以看出,从正态分布总体中抽取的样本大部分落在由”和工所确定的一个区域里,这个区域的屮心由均值向量“决定,区域的大小由协方差矩阵决定。在数理统计中,令:尸=(x_〃)T》-l(x_〃)式中7称为7、X到“的马氏距离(Mahalanobis)距离。所以,等密度点轨迹是x至吆的马氏距离尸为常数的超椭球面。该超椭球面构成的球体的大小是样本对于均值向量的“离散度度量”。体积:v=i/j-IZPd龙2d为偶数(-)!=2(d-iyd2•兀/?•(〒)!d为奇数、~d]_如果d确定了,则卩不变,v与迄忆有关。也就是对于给定的维数d,样本离散度随1工8、2而变。(1)不相关性等价于独立性概率论中,两个随机变量可和勺之间不相关,并不意味着它们一泄独立。如果可和勺之间不相关,贝%列的数学期望有:E(®Cj)=E(xJ・E(Xj)如果右和T相互独立,则有:P(x
3、值向量“是d维的。也就是:〃……〃广为d维均值向量。工是dxd维协方差矩阵,是工的逆矩阵,吃1为》的行列式。协方差矩阵工是对称的,其屮有dx(d+l)/2个独立元素。由于如)可由“和工完全确定,所以实际上poo可rhd+dx(d+i)/2个独立元素来确定。(兀-“)7是(X-“)的转置,且:^=E{x]Z=E{(x-//)U-A)r}肃是工的第i、j个元素。(3.1-6)“、工分别是向量X和矩阵(““)(“莎的期望。具体说:若兀是兀的第i个分量,M是〃的第i个分量,=E[Xj]=J%/p(x)dx=£°Xjp(Xj)dxj苴中/?(可)为边缘分布,p(x"=p-f°p
4、(x)dx}dx2--dxdJ—ooJ—oo“对于二维随机变量X和Y作为一个整体,其分布函数F(x,y),而X和Y都是随机变量,各别也有分布函数Fx(x)、FY(y),分别称为二维随机变量(X,Y)关于X和Y的边缘分布函数。有:Fx(%)=F(x,+oo)和Fy(y)=尸(+汽y)。对于离散随机变量有:00你⑴二Fg+oo)=工工心从中得到X的分布律为:无Vx7=1P{X=兀}=£心同样,Y的分布律为P{Y=yj}=YPij0;=1/=i对于连续型随机变量(X,Y),假定它的概率密度为m,y),由:Fx(x)=F(x,+oo)=r[[7(%,y}dylx知道,X的概
5、率密度为:J-ooJ-OO人⑴二匚/E)dy同样也可以求出Y的概率密度函数。”(3.1-7)而:冷=E[(可-角)(勺-“/)]=flIL(石一)(勺一“J)•Pg,Xj)dxidxj]协方差矩阵:(3.1-8)是一个对称矩阵,只考虑工为正左矩阵的情况,也就是I。所有的子式都大于Oo即1昂i>o,同单变量正态分布一样,多元正态分布°⑴可以由”和工完全确定,常记为。1.多元正态分布的性质(1)参数“和工对分布的决定性对丁维随机向量X,它的均值向量“也是d维的,协方差矩阵是对称的,其屮有d(d+l)/2个独立元素。p⑴可市〃和工完全确定,实际±p(x)可由d+d(d+l)
6、/2个独立元素决定。常记为:p(x)〜N(“,》)。(1)等密度点的轨迹为一超椭球面rtipw的定义公式(3.1-5)可知,当右边指数项为常数时,密度爪)的值不变,所以等密度点满足:(%-A)7Z-1(%-//)=常数可以证明,上式的解是一个超椭球面,其主轴方向取决于艺的本征向量(特征向量),主轴的长度与相应的本征值成正比。如下图所示:O)心〉"=2〉;(b)等密度点轨迹从上图可以看出,从正态分布总体中抽取的样本大部分落在由”和工所确定的一个区域里,这个区域的屮心由均值向量“决定,区域的大小由协方差矩阵决定。在数理统计中,令:尸=(x_〃)T》-l(x_〃)式中7称为
7、X到“的马氏距离(Mahalanobis)距离。所以,等密度点轨迹是x至吆的马氏距离尸为常数的超椭球面。该超椭球面构成的球体的大小是样本对于均值向量的“离散度度量”。体积:v=i/j-IZPd龙2d为偶数(-)!=2(d-iyd2•兀/?•(〒)!d为奇数、~d]_如果d确定了,则卩不变,v与迄忆有关。也就是对于给定的维数d,样本离散度随1工
8、2而变。(1)不相关性等价于独立性概率论中,两个随机变量可和勺之间不相关,并不意味着它们一泄独立。如果可和勺之间不相关,贝%列的数学期望有:E(®Cj)=E(xJ・E(Xj)如果右和T相互独立,则有:P(x
此文档下载收益归作者所有