欢迎来到天天文库
浏览记录
ID:82326291
大小:588.37 KB
页数:36页
时间:2024-08-29
《模式识别——贝叶斯决策理论.pptx》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库。
模式识别——贝叶斯决策理论 一最简单的贝叶斯分类算法还使用前面的例子:鲈鱼(seabass)和鲑鱼(salmon)。 使用一个特征亮度对这两种鱼进行表示。新来了一条鱼特征是x(亮度),怎么根据特征x确定它到底是鲈鱼ω1还是鲑鱼ω2?已知数据:鲈鱼类标号ω1,鲑鱼类标号ω2。鲈鱼总数量占所有鱼总数量的比率为P(ω1),鲑鱼总数量占所有鱼总数量的比率为P(ω2)。由鲈鱼的分布得知这条鱼的亮度x在分类为鲈鱼时出现的概率为p(x|ω1),由鲑鱼的分布得知这条鱼的亮度x在分类为鲑鱼时出现的概率为p(x|ω2)。 如何求解?可以求出x属于鲈鱼ω1的概率P(ω1|x)和x属于鲑鱼ω2的概率P(ω2|x)。如果P(ω1|x)>P(ω2|x),就认为x是鲈鱼。现在的问题是如何求P(ω1|x)和P(ω2|x)。 有一个概率公式:从而推出:换一种写法: 这就是著名的贝叶斯公式。其中P(ωj)叫做先验概率,就是类别出现的可能性;p(x|ωj)叫条件概率,就是在ωj时x出现的可能性;p(ωj|x)叫后验概率;p(x)是该样例出现的可能性。因此:对于上面的问题: 如果p(ω1|x)>p(ω2|x),那么就认为x属于ω1,即这条鱼是鲈鱼。同理于:这几个基本数据都已经给出了,因此可以计算出不等式的结果。如果p(ω1|x)
gj(x),那么认为x属于第i个类别ωi。比如令gi(x)=-R(αi|x)。上面是一个不等式关系,如果不等式两边都乘以相同的正数,或加上相同的树,或取自然对数。那么不等式的关系是不变的。因此不考虑损失时的贝叶斯判别函数:可以写成: 四正态分布贝叶斯公式中的p(x|ωj)是条件概率,代表在类别为ωj时,x的概率。比如在ωj为鲈鱼时,一个特定亮度x的概率。条件概率分布中常见的一个分布是高斯分布(正态分布)。正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss(CarlFriedrichGauss,1777—1855)率先将其应用于天文学家研究,故正态分布又叫高斯分布。 高斯分布的形状是钟形曲线。 很多随机变量的概率分布都可以近似地用正态分布来描述。例如:同一种生物体的身长、体重等指标;百度高个吧投票的身高分布: 在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种种子的重量;测量同一物体的误差;某个地区的年降水量;学生的智力水平,包括学习能力,实际动手能力等呈正态分布。 单变量正态分布的概率密度函数:其中μ是均值,σ是标准差。均值就是所有数的平均数,就是把所有数都加起来再除以个数σ2方差就是把每个数减去它们的平均数再平方,把这些平方加起来再除以个数。方差表示统计数据的离散程度。经常可以把上面的公式简写成:p(x)~N(μ,σ2)。 多变量正态分布的概率密度函数:其中μ是d维平均向量。Σ是d*d的协方差矩阵。|Σ|是它的行列式,Σ-1是它的转置。经常可以把上面的公式简写成:p(x)~N(μ,Σ)。 五正态分布下的判别函数 将多变量正态分布公式带入下面的判别函数:得到:将单变量正态分布公式带入下面的判别函数:得到: 1.Σi=σ2I当所有变量都相互独立,且每个变量的方差都是σ2的时候,所有的协方差矩阵都相等:Σi=σ2I。此时,判别函数简化成了:此时判别函数就变成了一个线性判别函数。 当p(ωi)与p(ωj)相等的时候,一二三维高斯分布: 如下求分割线x的位置: 当p(ωi)与p(ωj)不相等的时候,一二三维高斯分布: 2.Σi=Σ当所有类别的协方差矩阵Σi都相等的时候,说明所有类别的正态分布具有同样的形状。此时,判别函数又可以简化成一个线性判别函数器。 3.Σi不固定此时基本就没有什么可化简的了。
此文档下载收益归作者所有
举报原因
联系方式
详细说明
内容无法转码请点击此处