欢迎来到天天文库
浏览记录
ID:51910037
大小:361.00 KB
页数:10页
时间:2020-03-18
《模式识别复习.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第一章导引1、模式识别:就是利用计算机对某些物理对象进行分类,在错误概率最小的条件下,使识别的结果尽量与客观事物相符。2、模式:广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。3、模式的直观特性:a)可观察性b)可区分性c)相似性4、模式识别系统的目标:在特征空间和解释空间之间找到一种映射关系,这种映射也称之为假说。a)特征空间:从模式得到的对分类有用的度量、属性或基元构成的空间。b)解释空间:将c个类别表示为其中为所属类别的集合,称为解释空间。5
2、、数据聚类:a)目标:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。b)是一种非监督学习的方法,解决方案是数据驱动的。6、统计分类:a)基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。b)特征向量分布的获得是基于一个类别已知的训练样本集。c)是一种监督分类的方法,分类器是概念驱动的。7、结构模式识别:a)该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。b)识别采用结构匹配的形式,通过计算一个匹配程度值来评估一个未知的对象或未知对象某些部分与某种典型模式的关系如何。c)当成功地制定出了一组可以描述对象部分之间关系的规则后,可以应用一种特殊的句法
3、模式识别,来检查一个模式基元的序列是否遵守某种规则,即句法规则或语法。1、神经网络:a)神经网络是受人脑组织的生理学启发而创立的。b)由一系列互相联系的、相同的神经元组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。c)增强或抑制是通过调整神经元相互间联系的权重系数来实现。d)神经网络可以实现监督和非监督学习条件下的分类。2、模式识别系统的基本构成:数据获取特征提取和选择预处理分类决策分类器设计第二章聚类分析1、K-均值算法分类。P27第二章判别函数和可训练的确定性分类器1、线性判别函数:a)一个n维线性判别函数的一般形式:其中w0=(w1,w2,…,wn)T称为权向量(或参数向
4、量),x=(x1,x2,…,xn)T。b)d(x)也可表示为:d(x)=wTx其中,x=(x1,x2,…,xn,1)T称为增广模式向量,w=(w1,w2,…,wn+1)T称为增广权向量。2、既然有线性判别函数,为什么还要引进非线性判别函数?试分析由“线性判别函数”向“非线性判别函数”推广的思想和方法。a)答:实际中有很多模式识别问题并不是线性可分的,这时就需要采用非线性分类器,比如当两类样本分布具有多峰性质并互相交错时,简单的线性判别函数往往会带来较大的分类错误。这时,树分类器作为一种分段线性分类器,常常能有效地应用于这种情况。3、对于n维x向量,若用r次多项式,判别函数d(x)的权系数的
5、总项数为:4、势函数法——一种确定性的非线性分类算法。P64第三章统计判别及其可训练的模式分类器1、贝叶斯最小错误率。P672、贝叶斯最小风险决策。P69第四章特征选择和特征提取1、K-L变换降维分类特征提取。P120第五章神经网络1、什么是人工神经网络?所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处理系统(计算机)。2、有什么主要特点?a)优点i.固有的并行结构和并行处理ii.知识的分布存储iii.容错性iv.自适应性b)缺点i.不适于高精度的计算ii.不适于做类似顺序计数的工作iii.学习和训练往往是一个艰难的过程iv.必须克服时间域顺序处理方面的困难v.硬件限制v
6、i.正确的训练数据的收集3、人工神经网络模型的选取原则?a)网络大小b)所需输出类型c)联想记忆类型d)训练方法e)时间的限定4、误差反传算法(BP算法)的原理a)BP算法是有指导训练的前馈多层网络训练算法,是靠调节各层的加权,使网络学会由输入输出对组成的训练组。其学习过程由信号的正向传播与误差的反向传播两个过程组成。b)正向传播:输入样本——>输入层——>隐蔽层——>输出层如果输出层实际输出与期望输出不符,则反传误差。c)误差反向传播:输出误差——>隐蔽层——>输入层将误差分摊给各层所有单元,从而获得各层单元的误差信号,进而修正各单元的权值。2、误差反传算法(BP算法)的步骤a)初始化b
7、)输入训练样本对,正向计算各层输出c)计算网络输出误差d)反向计算各层误差信号e)调整各层权值f)检查网络总误差是达到到精度要求,如果满足,则结束,否则返回第2步。3、BP训练算法实现步骤准备:训练数据组。设网络具有m层,这里,m代表层号,而不是向量的类号。表示第m层中第j个结点的输出。(零层输出)等于xj,即第j个输入。表示从到的连接加权。a)将各加权随机置为小的随机数。可用均匀分布的随机数,以保证网络不被大的加权值所
此文档下载收益归作者所有