哈工大模式识别课件-第3章概率密度函数的参数估计

哈工大模式识别课件-第3章概率密度函数的参数估计

ID:37552927

大小:416.60 KB

页数:53页

时间:2019-05-11

哈工大模式识别课件-第3章概率密度函数的参数估计_第1页
哈工大模式识别课件-第3章概率密度函数的参数估计_第2页
哈工大模式识别课件-第3章概率密度函数的参数估计_第3页
哈工大模式识别课件-第3章概率密度函数的参数估计_第4页
哈工大模式识别课件-第3章概率密度函数的参数估计_第5页
资源描述:

《哈工大模式识别课件-第3章概率密度函数的参数估计》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章概率密度函数的参数估计3.0引言贝叶斯分类器中最主要的问题是类条件概率密度函数的估计。问题可以表示为:已有c个类别的训练样本集合D1,D2,…,Dc,求取每个类别的类条件概率密度。概率密度函数的估计方法参数估计方法:预先假设每一个类别的概率密度函数的形式已知,而具体的参数未知;最大似然估计(MLE,MaximumLikelihoodEstimation);贝叶斯估计(BayesianEstimation)。非参数估计方法。3.1最大似然估计样本集D中包含n个样本:x1,x2,…,xn,样本都是独立同分布的随机变量(i.i.d,independentidenticallydistribut

2、ed)。对类条件概率密度函数的函数形式作出假设,参数可以表示为参数矢量θ:似然函数由独立同分布假设,样本集D出现的概率为:定义对数似然函数:最大似然估计最大似然估计就是要寻找到一个最优矢量,使得似然函数最大。正态分布的似然估计Gauss分布的参数由均值矢量μ和协方差矩阵Σ构成,最大似然估计结果为:3.2贝叶斯估计已有独立同分布训练样本集D;已知类条件概率密度函数p(x

3、θ)的形式,但参数θ未知;已知参数θ的先验概率密度函数p(θ);求在已有训练样本集D的条件下,类条件概率密度函数p(x

4、D)。贝叶斯估计与最大似然估计的差别最大似然估计认为θ是一个确定的未知矢量;贝叶斯估计认为θ是一个随机变量,

5、以一定的概率分布取所有可能的值。贝叶斯估计的一般理论由于参数矢量θ是一个随机变量,所以类条件概率可以用下式计算:根据贝叶斯公式,有:单变量正态分布的贝叶斯估计已知概率密度函数满足正态分布,其中方差σ2已知,均值μ未知,假设μ的先验概率满足正态分布,即:均值的后验概率经推导可得,在已知训练样本集合D的条件下,参数μ的分布:均值的后验概率均值的后验概率仍满足正态分布,其中:均值分布的变化类条件概率密度的计算3.3期望最大化算法(EM算法)EM算法的应用可以分为两个方面:训练样本中某些特征丢失情况下,分布参数的最大似然估计;对某些复杂分布模型假设,最大似然估计很难得到解析解时的迭代算法。基本EM算法

6、令X是观察到的样本数据集合,Y为丢失的数据集合,完整的样本集合D=XY。由于Y未知,在给定参数θ时,似然函数可以看作Y的函数:基本EM算法由于Y未知,因此我们需要寻找到一个在Y的所有可能情况下,平均意义下的似然函数最大值,即似然函数对Y的期望的最大值:基本EM算法begininitialize,T,i0;doii+1E步:计算;M步:untilreturn混合密度模型一个复杂的概率密度分布函数可以由多个简单的密度函数混合构成:最常用的是高斯混合模型(GMM,GaussMixtureModel):GMM模型产生的2维样本数据两个高斯函数的混合混合密度模型的参数估计混合密度模型的参数可以表示

7、为:参数的估计方法:利用最优化方法直接对似然函数进行优化,如梯度下降法;引入未知隐变量Y对问题进行简化,将Y看作丢失的数据,使用EM算法进行优化。GMM模型的参数估计首先引入隐含数据集合:其中:代表第i个训练样本是由第个高斯函数产生的,将Y作为丢失数据集合,采用EM算法进行迭代估计。GMM参数的EM估计算法设定混合模型数M,初始化模型参数,阈值T,i0;用下列公式迭代计算模型参数,直到似然函数变化小于T为止:EM算法的性质EM算法具有收敛性;EM算法只能保证收敛于似然函数的局部最大值点(极值点),而不能保证收敛于全局最优点。隐含Markov模型(HiddenMarkovModel,HMM)有

8、一些模式识别系统处理的是与时间相关的问题,如语音识别,手势识别,唇读系统等;对这类问题采用一个特征矢量序列描述比较方便,这类问题的识别HMM取得了很好的效果。输入语音波形观察序列信号的特征需要用一个特征矢量的序列来表示:其中的vi为一个特征矢量,称为一个观察值。一阶Markov模型一阶Markov模型由M个状态构成,在每个时刻t,模型处于某个状态w(t),经过T个时刻,产生出一个长度为T的状态序列WT=w(1),…,w(T)。一阶Markov模型的状态转移模型在时刻t处于状态wj的概率完全由t-1时刻的状态wi决定,而且与时刻t无关,即:Markov模型的初始状态概率模型初始于状态wi的概率用

9、表示。完整的一阶Markov模型可以用参数表示,其中:一阶Markov模型输出状态序列的概率模型输出状态序列的概率可以由初始状态概率与各次状态转移概率相乘得到。例如:W5=w1,w1,w3,w1,w2,则模型输出该序列的概率为:一阶隐含Markov模型隐含Markov模型中,状态是不可见的,在每一个时刻t,模型当前的隐状态可以输出一个观察值。隐状态输出的观察值可以是离散值,连续值,也可以是一个矢量

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。