资源描述:
《统计模式识别简介》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、统计模式识别简介金新0937009吴曲0937028张巧玲0937036赵显峰0937041关于统计学的一个笑话:有一个从没带过小孩的统计学家,因为妻子出门勉强答应照看三个年幼好动的孩子。妻子回家时,他交出一张纸条,写的是:“擦眼泪11次;系鞋带15次;给每个孩子吹玩具气球各5次,累计15次;每个气球的平均寿命10秒钟;警告孩子不要横穿马路26次;孩子坚持要穿马路26次;我还要再过这样的星期六0次”。统计学真的这样呆板吗?仅仅收集数据,整理分析,累加平均…统计理论要解决的是从数据中做出一些推断、它为解决随机
2、观测事件的决策过程提供了理论基础。PR中的分类问题是根据识别对象特征的观测值,将其分到相应的类别中去。而统计决策理论是模式分类的主要理论和工具之一。下面我们介绍统计模式识别,以及几种最常用、也是最基本的统计决策方法。统计模式识别统计模式识别方法就是用给定的有限数量样本集,在已知研究对象统计模型或已知判别函数类条件下根据一定的准则通过学习算法把d维特征空间划分为c个区域,每一个区域与每一类别相对应。属于同一类别的各个模式之间的差异,部分是由环境噪声和传感器的性质所引起的,部分是模式本身所具有的随机性质。前者如
3、纸的质量、墨水、污点对书写字符的影响;后者表现为同一个人书写同一字符时,虽形状相似,但不可能完全一样。因此当用特征向量来表示这些在形状上稍有差异的字符时,同这些特征向量 对应的特征空间中的点便不同一,而是分布在特征空间的某个区域中。这个区域就可以用来表示该随机向量实现的集合。假使在特征空间中规定某种距离度量,从直观上看,两点之间的距离越小,它们所对应的模式就越相似。在理想的情况下,不同类的两个模式之间的距离要大于同一类的两个模式之间的距离,同一类的两点间连接线上各点所对应的模式应属于同一类。一个畸变不大的模
4、式所对应的点应紧邻没有畸变时该模式所对应的点。在这些条件下,可以准确地把特征空间划分为同各个类别相对应的区域。在不满足上述条件时,可以对每个特征向量估计其属于某一类的概率,而把有最大概率值的那一类作为该点所属的类别。模式识别系统在进行工作时只要判断被识别的对象落入哪一个区域,就能确定出它所属的类别。由噪声和传感器所引起的变异性,可通过预处理而部分消除;而模式本身固有的变异性则可通过特征抽取和特征选择得到控制,尽可能地使模式在该特征空间中的分布满足上述理想条件。因此一个统计模式识别系统应包含预处理、特征抽取、
5、分类器等部分(见图)。统计模式识别模型该模型主要包括两种操作模型:训练和分类,其中训练主要利用已有样本完成对决策边界的划分,并采取了一定的学习机制以保证基于样本的划分是最优的;而分类主要对输入的模式利用其特征和训练得来的决策函数而把模式划分到相应模式类中。基本原理统计模式识别(statisticpatternrecognition)的基本原理是:有相似性的样本在模式空间中互相接近,并形成“集团”,即“物以类聚”。其分析方法是根据模式所测得的特征向量Xi=(xi1,xi2,…,xid)T(i=1,2,…,N)
6、,将一个给定的模式归入C个类ω1,ω2,…,ωc中,然后根据模式之间的距离函数来判别分类。其中,T表示转置;N为样本点数;d为样本特征数。统计模式识别的方法有:贝叶斯决策方法(1)最小错误概率贝叶斯判别准则(2)最小风险贝叶斯判别(3)聂曼-皮尔逊判别准则准则判别函数法(1)线性可分的几何分类法(2)非线性可分的几何分类法监督参数统计法(1)KNN法(K最近邻法)(2)Fisher判别分析法非监督参数统计法(1)基于概率密度函数估计的直接方法(2)与样本空间相似性度量的间接聚类方法聚类分析法近邻函数法(1)
7、基于最邻近规范的试探法(2)最大最小距离法主要方法贝叶斯决策法线性判别函数邻近法分类(KNN)最小距离分类聚类分析法贝叶斯决策方法运用统计决策理论设计的分类系统又称为分类器。贝叶斯决策是一种统计模式识别决策法,它有如下基本假定:1.各类别总体的概率分布是已知的2.被决策的分类数是一定的3.被识别的事物或对象有多个特征观测值当被识对象用n随机向量X表示,二我们已知分类的先验概率的条件概率密度函数,便可根据贝叶斯公式,求解后验概率,并按后验概率的大小来判别分类,这就是贝叶斯决策方法。下面介绍三种判别准则:(1)
8、最小错误概率贝叶斯判别准则(2)最小风险贝叶斯判别(3)聂曼-皮尔逊判别准则准则(1)最小错误概率贝叶斯判别准则设有R类样本,分别为w1,w2,…wR,已知每类的先验概率为P(wi),其中i=1,2,…,R。对于待识别的随机向量X,已知每类的条件概率密度为P(X
9、wi),则根据贝叶斯公式有后验概率:P(wi
10、X)=(P(X
11、wi)*P(wi))/(∑P(X∣wi)*P(wi))(1)根据计算得出得后验概率,取最大