模式识别考试总结.doc

模式识别考试总结.doc

ID:59354569

大小:76.00 KB

页数:5页

时间:2020-09-04

模式识别考试总结.doc_第1页
模式识别考试总结.doc_第2页
模式识别考试总结.doc_第3页
模式识别考试总结.doc_第4页
模式识别考试总结.doc_第5页
资源描述:

《模式识别考试总结.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1.对一个染色体分别用一下两种方法描述:(1)计算其面积、周长、面积/周长、面积与其外接矩形面积之比可以得到一些特征描述,如何利用这四个值?属于特征向量法,还是结构表示法?(2)按其轮廓线的形状分成几种类型,表示成a、b、c等如图表示,如何利用这些量?属哪种描述方法?(3)设想其他的描述方法。  (1)这是一种特征描述方法,其中面积周长可以体现染色体大小,面积周长比值越小,说明染色体越粗,面积占外接矩形的比例也体现了染色体的粗细。把这四个值组成特征向量可以描述染色体的一些重要特征,可以按照特征向量匹配方法计算样本间的相似度。可以区分染色体和其它圆形、椭圆细胞结构。  (2)a形曲线

2、表示水平方向的凹陷,b形表示竖直方向的凹陷,c形指两个凹陷之间的突起,把这些值从左上角开始,按顺时针方向绕一圈,可以得到一个序列描述染色体的边界。它可以很好的体现染色体的形状,用于区分X和Y染色体很合适。这是结构表示法。(3)可以先提取待识别形状的骨架,在图中用蓝色表示,然后,用树形表示骨架图像。  2.设在一维特征空间中两类样本服从正态分布,,两类先验概率之比,试求按基于最小错误率贝叶斯决策原则的决策分界面的x值。 答:由于按基于最小错误率的贝叶斯决策,则分界面上的点服从  3、设两类样本的类内离散矩阵分别为  ,    试用fisher准则求其决策面方程,并与第二章习题二的结构

3、相比较。4,设在一个二维空间,A类有三个训练样本,图中用红点表示,B类四个样本,图中用蓝点表示。    试问:  (1)按近邻法分类,这两类最多有多少个分界面  (2)画出实际用到的分界面  (3)A1与B4之间的分界面没有用到  答:    由于两类样本分布形状是相同的(只是方向不同),因此应为两类均值的中点  。 下图中的绿线为最佳线性分界面。    答:按近邻法,对任意两个由不同类别的训练样本构成的样本对,如果它们有可能成为测试样本的近邻,则它们构成一组最小距离分类器,它们之间的中垂面就是分界面,因此由三个A类与四个B类训练样本可能构成的分界面最大数量为3×4=12。  实际

4、分界面如下图所示,由9条线段构成:  5,给定先验概率相等的两类,其均值向量分别为:和,协方差矩阵是:    求用J2判据的最优特征提取。  解:根据前面的分析,应先求,再求此矩的特征矩阵。  今有混合均值  类间离散度矩阵: 类内离散度矩阵 则  接着,需求的特征值矩阵。由于这是一个两类别问题,总均值向量μ值是两个均值向量μ1和μ2的线性求和,则中只有一个是独立的,因此的秩是一,换句话说只有一个非零特征值,W是D×1矩阵,是一个向量W,求该向量需解 而代入式得    由于是一个标量,所以    因此利用W向量对原始的两维样本进行线性变换,得到新的一维分布,特征空间从两维降到一维,

5、并满足J2判据。非参数概念:4.8.2.1单独最优特征组合  这是一种最简单的方法,即将各特征按单独使用计算其判据值,然后取其前d个判据值最大的特征作为最优特征组合。这种做法的问题在于即使各特征是独立统计的,也不一定得到最优结果。但如果可分性判据可写成如下形式    或  则用这种方法可以选出一组最优的特征来。例如当两类都是正态分布,各特征统计独立时,用Mahalanobis距离作为可分性判据,上述条件可以满足。4.8.2.2顺序前进法(SFS)  这是最简单的自下而上搜索方法。首先计算每个特征单独进行分类的判据值,并选择其中判据值最大的特性,作为入选特征。然后每次从未入选的特征中

6、选择一个特征,使得它与已入选的特征组合在一起时所得的J值为最大,直到特征数增至d个为止。顺序前进法与前一小节的单独特征最优化组合相比,一般说来,由于考虑了特征之间的相关性,在选择特征时计算与比较了组合特征的判据值,要比前者好些。其主要缺点是,一旦某一特征被选入,即使由于后加入的特征使它变为多余,也无法再把它剔除。该法可推广至每次入选r个特征,而不是一个,称为广义顺序前进法(GSFS)。  4.8.2.3顺序后退法(SBS)  这是一种与上一节相反的方法,是自上而下的方法。做法也很简单,从现有的特征组中每次减去一个不同的特征并计算其判据,找出这些判据值中之最大值,如此重复下去直到特征

7、数达到予定数值d为止。与SFS相比,此法计算判据值是在高维特征空间进行的,因此计算量比较大。此法也可推广至每次剔除r个,称为广义顺序后退法(GSBS)。6/请想一下,什么情况下P(ω1

8、X)=1或P(ω2

9、X)=1?P(ω1

10、X)=P(ω2

11、X)会出现什么什么情况?  答:一般来说,在某一类样本分布密集区,某一类的后验概率接近或等于1。此时,基于最小错误率贝叶斯决策基本没错,而近邻法出错可能也很小。而后验概率近似相等一般出现在两类分布的交界处,此时分类没有依据,因此基

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。