资源描述:
《最小风险的Bayes决策.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库。
1、最小风险的Bayes决策让错误率最小的Bayes决策是重要的但,错误率最小的Bayes决策是否最佳?正常细胞误判为癌细胞癌细胞误判为正常细胞不同性质的错误会引起不同程度的损失(后果)评价决策的优劣:总损失比总错误率更恰当最小风险的Bayes决策就是把各种分类错误而引起的损失考虑进去的Bayes决策法则1风险的表示例:病理切片X,要确定其中有没有癌细胞(用ω1表示正常,ω2表示异常)P(ω1
2、X)与P(ω2
3、X)分别表示了两种可能性的大小若X为正常细胞,判断为ω2,损失为21若X为癌细胞,判断为ω1,损失为12X判断为ω1,其风险R1(X)=12P(ω2
4、X)X判断为ω2
5、,其风险R2(X)=21P(ω1
6、X)损失和误判概率的加权和可以有效的表示决策风险2决策空间的相关符号观察向量状态空间决策空间损失函数期望损失(条件风险)(A)3最小风险的Bayes决策规则最小风险的Bayes决策规则:使期望损失最小的决策状态即为最小风险的Bayes决策定义期望风险:最小风险的Bayes决策使平均风险最小!期望风险R反映对整个特征空间上所有的X的取值采用相应的决策α(x)所带来的平均风险4最小风险的Bayes决策规则步骤(1)在已知P(ωj),P(X
7、ωj),j=1,…,c及给出待识别的X的情况下,根据贝叶斯公式计算出后验概率:(2)利用计算出的后验概率及
8、决策表,计算出采取αi,i=1,…,a的条件风险(3)对(2)中得到的a个条件风险值R(αi
9、X),i=1,…,a进行比较,找出使条件风险最小的决策αk,则αk就是最小风险贝叶斯决策5例状态损失决策ω1ω2α1α20061决策表在例1条件的基础上,并且已知λ11=0,(λ11表示λ(1,ω1)的简写),λ12=6,λ21=1,λ22=0,按最小风险贝叶斯决策进行分类。P(ω1)=0.9,P(ω2)=0.1p(X
10、ω1)=0.2,p(X
11、ω2)=0.46计算后验概率:P(ω1
12、X)=0.818,P(ω2
13、X)=0.182计算条件风险:找最小的条件风险:最小风险的Bayes决策
14、为2!7决策规则的进一步探讨二类问题的决策规则:另一种决策规则:先验概率的决策规则:似然比8最小错误决策和最小风险决策二类问题中,若,则两种判决方式等价多类问题中,若则有所有错误代价相同!两种判决方式等价!0-1·损失函数93.3Bayes分类器和判别函数决策面:划分决策域的边界面决策面方程:决策面的数学解析形式判别函数:表达决策规则的函数维特征空间个决策域决策规则分类器设计:利用决策规则对观察向量X进行分类决策面方程和判别函数由相应的决策规则所决定!10判别函数和决策面方程类的情况下,对应的判别函数为若则属于第类分割它们的决策面方程应满足:对于多类:通常定义一组判别函数1
15、1最小错误概率决策判别函数的不同形式:12最小风险决策判别函数判别函数不唯一,更一般地,(其中为单调增函数)均可作为判别函数13Bayes分类器14决策界同一决策规则下判别函数形式可以不同,但决策界相同!15决策界同一决策规则下判别函数形式可以不同,但决策界相同!16二类分类器17例有一家医院为了研究癌症的诊断,对一大批人作了一次普查,给每人打了试验针,然后进行统计,得到统计数字:(1)这批人中,每1000人有5个癌症病人;(2)这批人中,每100个正常人有1人对试验的反应为阳性;(3)这批人中,每100个癌症病人有95人对试验的反应为阳性。假如正常人用表示,癌症病人用表示。
16、以试验结果作为特征,特征值为阳或阴。根据统计数字,得到如下概率:现在有一某甲,试验结果为阳性,按最小错误率贝叶斯决策规则,问诊断结果是什么?18后验概率:判决比较判断正常概率19风险评估假设λ11=0,λ12=3,λ21=1,λ22=0,按最小风险贝叶斯决策为某甲诊断:由于R1(X)>R2(X)即决策为ω2的条件风险小于决策为ω1的条件风险,因此诊断某甲为癌症病人。采用最小风险贝叶斯决策,各种损失的确定是关键问题:λ11=0,λ12=2,λ21=1,λ22=0,按最小风险贝叶斯决策的诊断又如何呢?20分别写出两种情况的决策面方程1.2.决策面方程g(x)=021前面介绍了在一
17、般的概率统计分布情况下的统计决策理论,这一节我们要讨论最常用的正态分布情况在模式识别中,正态分布假设是对各种随机变量使用得最普遍的假设这主要有两方面的原因:1)正态分布在数学上比较简便2)正态分布在物理上的合理性正态分布的Bayes决策法则22数学上简便性正态分布是数学上最简单的一种分布。它的一些特殊情况揭示了统计判别方法中许多重要的性质在模式识别技术的研究中,需要用训练样本集来设计分类器,还需用测试样本集来检验分类器的分类效果,并对不同的分类器的性能进行比较用正态分布模型描述训练样本集与测试样本集在数