《特征提取和选择》PPT课件

《特征提取和选择》PPT课件

ID:41243552

大小:804.23 KB

页数:72页

时间:2019-08-20

《特征提取和选择》PPT课件_第1页
《特征提取和选择》PPT课件_第2页
《特征提取和选择》PPT课件_第3页
《特征提取和选择》PPT课件_第4页
《特征提取和选择》PPT课件_第5页
资源描述:

《《特征提取和选择》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第5章特征提取和选择5.1引言5.2基本概念5.3类别可分性判据5.4基于可分性判据的特征提取5.5主分量分析(PCA)在模式识别领域,特征的提取与选择是最关键的问题之一,同时也是最困难的问题之一。不同的模式识别应用,需要采用不同的特征提取与选择方法。对于实际的模式识别问题,以人脸识别为例,一开始的原始特征可能很多,如在人脸数据库中,每幅图像的分辨率为11292,即高达10304维。若把所有的原始特征都作为分类特征送到分类器,不仅使得分类器复杂,分类判别计算量大,而且分类错误概率也不一定小;原始特征的特征空间有很大的冗余,完全可以用很小的空间

2、相当好地近似表示图像,这一点与压缩的思想类似。因此有必要减少特征数目,以获取“少而精”的分类特征,即获取特征数目少且能使分类错误概率小的特征向量。模式识别中减少特征数目(或压缩特征空间)的方法有两种:一种是特征提取,另一种是特征选择。5.1引言在模式识别系统中,确定分类和学习过程所使用的特征是非常重要的一个环节,获得对分类最有效的特征,同时尽最大可能减少特征维数,是特征选取的主要任务。特征选取可以分成原始特诊的采集和转换、有效特征的生成两个步骤。原始特征:通过直接测量得到的特征称为原始特征。比如人体的各种生理指标(描述其健康状况);数字图像中的

3、每点灰度值(以描述图像内容),都是原始特征。特征提取:通过映射(变换)的方法把高维的特征向量变换为低维的特征向量。通过特征提取获得的特征是原始特征集的某种组合,即A:X→Y,可见新的特征中包含有原有全体特征的信息。特征选择:从原始特征中挑选出一些最有代表性、分类性能好的特征以达到降低特征空间维数的目的。也就是说,特征选择就是从已有的D个原始特征中挑选出d个特征组成一个特征子集,同时将D-d个对类别可分离性无贡献的或贡献不大的特征简单地忽略掉。特征提取与具体问题有很大关系,目前没有理论能给出对任何问题都有效的特征提取方法。?如:♦用傅立叶变换或小

4、波变换的系数作为图像的特征;?♦用PCA方法作特征压缩;?♦用LDA(线性判别分析,LinearDiscriminantAnalysis)方法作特征压缩。5.2基本概念1.特征的特点模式识别的主要功能在于利用计算机实现人的类识别能力,它是一个与领域专门知识有关的问题。研究领域不同,选择的特征也不同,但不论采用什么样的特征,都应该满足如下条件:(1)特征可以获取模式识别系统的主要处理设备是计算机,因此作为观察对象的数字化表达,观察对象应该是可以通过数据采集设备输入到计算机的。目前,市场上有各种传感设备和数字化设备,如采集图像信息的图像卡和采集语音

5、信息的声卡等。作为特征,既可以是数字化表达的结果,也可以是在数字化表达基础上形成的参数性质的值,如图像分割后的子目标特征表达等。(2)类内稳定选择的特征对同一类应具有稳定性。由于模式类是由具有相似特性的若干个模式构成的,因此它们同属一类模式,其首要前提是特性相似,反映在取值上,就应该有较好的稳定性。(3)类间差异选择的特征对不同的类应该有差异。若不同类的模式的特征值差异很小,则说明所选择的特征对于不同的类没有什么差异,作为分类的依据时,容易使不同的类产生混淆,使误识率增大。一般来讲,特征的类间差异应该大于类内差异。(1)具有很大的识别信息量。即

6、应具有很好的可分性。(2)具有可靠性。模棱两可、似是而非、时是时非等不易判别的特征应丢掉。(3)尽可能强的独立性。重复的、相关性强的特征只选一个。(4)数量尽量少,同时损失的信息尽量小。2.对特征的要求3.特征的类别特征是用于描述模式性质的一种量,从形式上看可以分为三类:(1)物理特征物理特征是比较直接、人们容易感知的特征,一般在设计模式识别系统时容易被选用。如为了描述指定班级中的某个学生,可以用以下物理特征:性别、身高、胖瘦、肤色等外在特征。物理特征虽然容易感知,却未必能非常有效地表征分类对象。(2)结构特征结构特征的表达能力一般要高于

7、物理特征,如汉字识别的成功实现离不开结构特征的选择。结构特征的表达是先将观察对象分割成若干个基本构成要素,再确定基本要素间的相互连接关系。通过要素和相互连接关系表达对象,可以较好地表达复杂的图像信息,在实际中已经有较多的成功应用,如指纹的识别就是基于结构信息完成的。结构信息对对象的尺寸往往不太敏感,如汉字识别时,识别系统对汉字大小不敏感,只对笔划结构信息敏感。结构特征比物理特征要抽象一些,但仍属比较容易感知的特征,如人的指纹特征、人脸的五官结构信息等,是目前认定人的身份的重要参数。(3)数字特征一般来说,数字特征是为了表征观察对象而设立的特

8、征,如给每个学生设立一个学号,作为标志每个学生的特征。由于学号是人为设定的,可保证唯一性,但这种特征是抽象的,不容易被人感知。数字特征有时和观察对象的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。