资源描述:
《实验一模式识别》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实验一安装并使用模式识别工具箱(2学时)一、实验目的1.掌握安装模式识别工具箱的技巧,能熟练使用工具箱中的各项功能;2.熟练使用最小错误率贝叶斯决策器对样本分类;3.熟练使用感知准则对样本分类;4.熟练使用最小平方误差准则对样本分类;5.了解近邻法的分类过程,了解参数K值对分类性能的影响(选做);6.了解不同的特征提取方法对分类性能的影响(选做)。二、实验内容1.安装模式识别工具箱;2.用最小错误率W叶斯决策器对呈正态分布的两类样本分类;3.用感知准则对两类可分样木进行分类,并观测迭代次数对分类性能的影响;4.用最小平方误差准则对云状样本分类,并与贝叶斯决策器的分类结果比较:5
2、.用近邻法对双螺旋样本分类,并观测不同的K值对分类性能的影响(选做);6.观测不同的特征提取方法对分类性能的影响(选做)。三、实验仪器、设备1.PC机一系统最低配置512M内存、P4CPU;2.Matlab仿真软件一7.0/7.1/2006a等版本的Matlab软件。四、实验原理1.模式识别工具箱模式识别工具箱是学习模式识别基本原理、灵活应用既有的模式识别方法、开发研制新的识别方法、提高学生分析和解决问题能力的一个良好平台。本实验采用的模戎识别工具箱是由EladYom-Tov,HilitSerby和DavidG.Storka等人开发的。2.最小错误率災叶斯决策器在模式识别领域,
3、贝叶斯决策通常利用一些决策规则来判定样木的类别。最常见的决策规则有最大后验概率决策和最小风险决策等。设共有/r个类别,各类别用符号q什=1,2,...,幻代表。假设q类出现的先验概率巧以以及类条件概率密度是己知的,那么应该把X划分到哪一类才合适呢?若采用最大后验概率决策规则,首先计算x属于q类的后验概率lrxK1卜p(7—7^()2LP(c,)P(xkJ*=]然后将X判决为属于Cf类,其屮MWk=argmaxP{ck
4、x)<,k<.K若采用最小风险决策,则首先计算将x判决为cA类所带来的风险再将X判决为属于类,其中石=min/?(x,q)可以证明在采用0-1损失函数的前提下
5、,两种决策规则是等价的。W叶斯决策器在先验概率P&:)以及类条件概率密度phitj已知的前提下,利用上述贝叶斯决策规则确定分类面。贝叶斯决策器得到的分类面是最优的,它是最优分类器。但贝叶斯决策器在确定分类面前需要预知与巧xk;J,这在实际运用中往往不可能,因为—般是未知的。因此贝叶斯决策器只是一个理论上的分类器,常用作衡量其它分类器性能的标尺。1.感知准则设有一组样本Xl,X2,…,x;v,其中x„是规范化增广样本向量。现欲寻找一个解向量a,使得a,>0。感知准则通过使"(a)=X(_a7x)〉0XG/?最小而求出向量a,其中/?是被解向量a错分的样本集。上式一般用梯度下降法
6、求解。2.最小平方误差准则设有一组样本Xl,x2,…,X。,其中X,,是规范化增广样本向量。现欲寻找一个解向Ma,使得,=么>0。最小平方误差准则通过使A(a)=^(arxn-Z?J2'1=1最小而求出向量a。上式一般用最小二乘法求解。1.近邻法原理近邻法是一种经典的模式识别方法。正如其名所示,近邻法在分类吋运用如下“最近邻分类规则”对测试样木X进行分类:在X的周围找出离其最近的A个近邻样本,该A个样本中最频繁出现的那一类样本所对应的类别就是X所属的类别。以图1-1为例,图中存在两类样本,第一类记为^并用黑点表示,第二类记为并用方框表示。现欲用NN判决x是属于类还是c2类。假
7、设取A=5,则可找出x的5个近邻样本并用圆圈围住,圆圈中有3个样本属于c,类(目标值=z/=l,2,3),2个样本属于类(目标值h=4,5),那么x根据规则应属于c,类。图1-1近邻法的分类原理示意图2.特征提取特征提取是模式识别屮的关键一环。因为原始的特征数量可能很大,或者说样本处于一个高维空间中,因此可以通过映射或变换的办法在低维空间中来表示样本,这个过程就是特征提取。常见的特征提取方法有主成分分析(PCA)与主曲线等。更详细的内容可参见教材第8章。五、实验步骤1.安装模式识别工具箱。首先将工具箱文件拷W至指定文件夹里,然后在MATLAB环境下将该文件夹设置成“curren
8、tdirectory,即当前文件夹);最后在MATLAB命令行状态卜,键入Classifier并按回车键;则可得到如图1-2所示主界面。在该主界面上,可以装入样本文件(见界面“Filename”处),可以选择特征提取方式(见界面“preprocessing”处),可以选择不同的模式识别方法(见界面“algorithms”处),识别结果(识别错误率)显¥在界面“classificationerrors”处。图1-2模式识别工具箱主界面1.用最小错误率W叶斯决策器对呈正态分布的两类样本分类。首先