统计决策理论-bayes定理.ppt

统计决策理论-bayes定理.ppt

ID:50205805

大小:979.00 KB

页数:28页

时间:2020-03-10

统计决策理论-bayes定理.ppt_第1页
统计决策理论-bayes定理.ppt_第2页
统计决策理论-bayes定理.ppt_第3页
统计决策理论-bayes定理.ppt_第4页
统计决策理论-bayes定理.ppt_第5页
资源描述:

《统计决策理论-bayes定理.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、统计决策理论1关于统计学的一个笑话:有一个从没带过小孩的统计学家,因为妻子出门勉强答应照看三个年幼好动的孩子。妻子回家时,他交出一张纸条,写的是:“擦眼泪11次;系鞋带15次;给每个孩子吹玩具气球各5次,累计15次;每个气球的平均寿命10秒钟;警告孩子不要横穿马路26次;孩子坚持要穿马路26次;我还要再过这样的星期六0次”。统计学真的这样呆板吗?仅仅收集数据,整理分析,累加平均…2统计学以数据为研究内容,但仅仅收集数据,决不构成统计学研究的全部。下面介绍几种最常用、也是最基本的统计决策方法。这些方法是以后各种模式识别方法的基础。3贝叶斯决策理论方法是统计

2、模式识别中的一个基本方法,用这种方法进行分类时要求满足以下两个条件:(1)各类别总体的概率分布是已知的;(2)要决策的类别数是一定的。在连续的条件下,假设要识别的对象有d种特征测量值,每一种特征都是一个随机变量,因此组成d维随机向量,d种特征的所有的取值范围构成了d维特征空间。2.1Bayes定理4贝叶斯决策理论方法所讨论的问题是:已知总共有c个类别及各类别ωi=1,2,…,c的先验概率P(ωi)及类条件概率密度函数p(x

3、ωi)已知的条件下,如何对某一样本按其特征向量分类的问题。由于属于不同类的待识别对象存在着呈现相同观察值的可能,即所观察到的某一样本

4、的特征向量为X,而在c类中又有不止一类可能呈现这一X值,这种可能性可用P(ωi

5、X)表示。如何作出合理的判决就是贝叶斯决策理论所要讨论的问题。5先验概率预先已知的或者可以估计的模式识别系统位于某种类型的概率,即根据大量统计确定某类事物出现的比例。如我国理工科大学男女生比例大约为8:2,则在这类学校一个学生是男生的先验概率为0.8,而为女生的概率是0.2,两个概率之和为1。6类条件概率密度函数系统位于某种类型条件下模式样本出现的概率密度分布函数。男女生比例是男生与女生这两类事物之间的关系,而男生高度的分布则与女生的分布无关。为了强调是同一类事物内部,因此这

6、种分布密度函数往往表示成条件概率的形式。例如X表示某一个学生的特征向量,则男生的类条件概率密度表示成P(X

7、男生),女生的表示成P(X

8、女生),这两者之间没有任何关系,可为从0~1之间的任意值。7后验概率一个具体样本属于某种类别的概率。例如一个学生用特征向量X表示,它是男性或女性的概率表示成P(男生

9、X)和P(女生

10、X),这就是后验概率。由于一个学生只可能为两个性别之一,因此有P(男生

11、X)+P(女生

12、X)=1,这一点是与类分布密度函数不同的。后验概率与先验概率也不同,后验概率涉及一个具体事物,而先验概率是泛指一类事物,因此P(男生

13、X)和P(男生)是两

14、个不同的概念。8贝叶斯公式两个事物X与w联合出现的概率称为联合概率,可写成P(X,w),它们又可与条件概率联系起来,即P(X,w)=P(X

15、w)P(w)=P(w

16、X)P(X),这就是贝叶斯公式。如果将上式中各个项与先验概率,类条件概率密度函数以及后验概率联合起来,可以找到利用先验概率,类条件概率分布密度函数计算后验概率的方法。92.1Bayes定理假设每个要识别的细胞已作过预处理,并抽取出了d个特征描述量,用一个d维的特征向量X表示,识别的目的是要依据该X向量将细胞划分为正常细胞或者异常细胞。这里我们用ω1表示是正常细胞,而ω2则属于异常细胞。下面我们从

17、一个两类情况的例子——癌细胞识别出发来讨论,然后推广到一般情况。102.1Bayes定理根据医院细胞病理检查的大量统计资料可以对某一地区正常细胞和异常细胞出现的比例作出估计,即已知先验概率P(ω1)和P(ω2),P(ω1)+P(ω2)=1。显然一般情况下P(ω1)>P(ω2),因此如果不仔细观察具体的细胞化验值,该细胞是正常细胞的判决,在统计的意义上来说,错判可能性比判为异常细胞时小。但仅按先验概率来决策,就会把所有细胞都划归为正常细胞,并没有达到将正常细胞与异常细胞区分开的目的。这表明由先验概率所提供的信息太少。11为此必须利用抽取到的d维观测向量。为

18、简单起见,假定d=1,并已知两类的类条件概率密度函数分布,如图所示,其中P(x

19、ω1)是正常细胞的属性分布,P(x

20、ω2)是异常细胞的属性分布。类条件概率密度图12由Bayes公式得到:式中于是由先验概率转化为后验概率P(ωj

21、x)。如果对待分类模式的特征我们得到一个观察值x,经上式计算出结果,则判决X属于,反之,属于。132.2Bayes决策14例1:在细胞的化验中,要区分正常和异常的两种类型,分别用w1和w2表示,已知p(w1)=0.85,p(w2)=0.15,现有一待测细胞,其观测值为X,从类条件概率密度分析曲线上查得p(x/w1)=0.15,p(

22、x/w2)=0.45,试对该细胞进行分类。2.2Bayes决策15所以这次化验的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。