欢迎来到天天文库
浏览记录
ID:59354569
大小:76.00 KB
页数:5页
时间:2020-09-04
《模式识别考试总结.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1.对一个染色体分别用一下两种方法描述:(1)计算其面积、周长、面积/周长、面积与其外接矩形面积之比可以得到一些特征描述,如何利用这四个值?属于特征向量法,还是结构表示法?(2)按其轮廓线的形状分成几种类型,表示成a、b、c等如图表示,如何利用这些量?属哪种描述方法?(3)设想其他的描述方法。 (1)这是一种特征描述方法,其中面积周长可以体现染色体大小,面积周长比值越小,说明染色体越粗,面积占外接矩形的比例也体现了染色体的粗细。把这四个值组成特征向量可以描述染色体的一些重要特征,可以按照特征向量匹配方法计算样本间的相似度。可以区分染色体和其它圆形、椭圆细胞结构。 (2)a形曲线
2、表示水平方向的凹陷,b形表示竖直方向的凹陷,c形指两个凹陷之间的突起,把这些值从左上角开始,按顺时针方向绕一圈,可以得到一个序列描述染色体的边界。它可以很好的体现染色体的形状,用于区分X和Y染色体很合适。这是结构表示法。(3)可以先提取待识别形状的骨架,在图中用蓝色表示,然后,用树形表示骨架图像。 2.设在一维特征空间中两类样本服从正态分布,,两类先验概率之比,试求按基于最小错误率贝叶斯决策原则的决策分界面的x值。 答:由于按基于最小错误率的贝叶斯决策,则分界面上的点服从 3、设两类样本的类内离散矩阵分别为 , 试用fisher准则求其决策面方程,并与第二章习题二的结构
3、相比较。4,设在一个二维空间,A类有三个训练样本,图中用红点表示,B类四个样本,图中用蓝点表示。 试问: (1)按近邻法分类,这两类最多有多少个分界面 (2)画出实际用到的分界面 (3)A1与B4之间的分界面没有用到 答: 由于两类样本分布形状是相同的(只是方向不同),因此应为两类均值的中点 。 下图中的绿线为最佳线性分界面。 答:按近邻法,对任意两个由不同类别的训练样本构成的样本对,如果它们有可能成为测试样本的近邻,则它们构成一组最小距离分类器,它们之间的中垂面就是分界面,因此由三个A类与四个B类训练样本可能构成的分界面最大数量为3×4=12。 实际
4、分界面如下图所示,由9条线段构成: 5,给定先验概率相等的两类,其均值向量分别为:和,协方差矩阵是: 求用J2判据的最优特征提取。 解:根据前面的分析,应先求,再求此矩的特征矩阵。 今有混合均值 类间离散度矩阵: 类内离散度矩阵 则 接着,需求的特征值矩阵。由于这是一个两类别问题,总均值向量μ值是两个均值向量μ1和μ2的线性求和,则中只有一个是独立的,因此的秩是一,换句话说只有一个非零特征值,W是D×1矩阵,是一个向量W,求该向量需解 而代入式得 由于是一个标量,所以 因此利用W向量对原始的两维样本进行线性变换,得到新的一维分布,特征空间从两维降到一维,
5、并满足J2判据。非参数概念:4.8.2.1单独最优特征组合 这是一种最简单的方法,即将各特征按单独使用计算其判据值,然后取其前d个判据值最大的特征作为最优特征组合。这种做法的问题在于即使各特征是独立统计的,也不一定得到最优结果。但如果可分性判据可写成如下形式 或 则用这种方法可以选出一组最优的特征来。例如当两类都是正态分布,各特征统计独立时,用Mahalanobis距离作为可分性判据,上述条件可以满足。4.8.2.2顺序前进法(SFS) 这是最简单的自下而上搜索方法。首先计算每个特征单独进行分类的判据值,并选择其中判据值最大的特性,作为入选特征。然后每次从未入选的特征中
6、选择一个特征,使得它与已入选的特征组合在一起时所得的J值为最大,直到特征数增至d个为止。顺序前进法与前一小节的单独特征最优化组合相比,一般说来,由于考虑了特征之间的相关性,在选择特征时计算与比较了组合特征的判据值,要比前者好些。其主要缺点是,一旦某一特征被选入,即使由于后加入的特征使它变为多余,也无法再把它剔除。该法可推广至每次入选r个特征,而不是一个,称为广义顺序前进法(GSFS)。 4.8.2.3顺序后退法(SBS) 这是一种与上一节相反的方法,是自上而下的方法。做法也很简单,从现有的特征组中每次减去一个不同的特征并计算其判据,找出这些判据值中之最大值,如此重复下去直到特征
7、数达到予定数值d为止。与SFS相比,此法计算判据值是在高维特征空间进行的,因此计算量比较大。此法也可推广至每次剔除r个,称为广义顺序后退法(GSBS)。6/请想一下,什么情况下P(ω1
8、X)=1或P(ω2
9、X)=1?P(ω1
10、X)=P(ω2
11、X)会出现什么什么情况? 答:一般来说,在某一类样本分布密集区,某一类的后验概率接近或等于1。此时,基于最小错误率贝叶斯决策基本没错,而近邻法出错可能也很小。而后验概率近似相等一般出现在两类分布的交界处,此时分类没有依据,因此基
此文档下载收益归作者所有