欢迎来到天天文库
浏览记录
ID:56189544
大小:342.50 KB
页数:5页
时间:2020-03-18
《模式识别样卷参考解答.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、1、提纲:第1、2、3、4、5、7、8章所学内容2、题型:一、填空题1.模式识别系统主要由四个部分组成,即:1数据获取2预处理3特征提取和选择4分类决策。2.贝叶斯决策最常用的准则(1)最小错误率准则(2)最小风险准则3.请写出样本x和均值u之间的欧式距离,以及马式距离为开根号3.名词解释(先英文全拼,后中文解释,6分):PCA:PrincipalComponentAnalysis,主成分分析.NN:NeuralNetworks,神经网络.PR:PatternRecognition,模式识别4.根据平方误差
2、准则函数,其最小二乘近似解(MSE解)为5.估计量的评价标准1无偏性,2___有效性__3__一致性__。二、简述题1.试结合K-L变换简述人脸识别的过程。书223答:1.从给定样本集中选取训练集,训练集的大小可选,但直接影响识别的正确率。2.根据生产矩阵E[(x-μ)(x-μ)T]计算出特征脸。为了简化计算,这里用到奇异值分解,其基本原理是通过计算较低矩阵的特征值和特征向量而间接求出较高维矩阵的特征向量(特征脸)。3.求出训练集中各图像在特征脸空间中的坐标。4.通过将待识别样本f投影到特征脸子空间求出其系
3、数向量然重建图像最后考虑图像的信噪比,若小于阈值则可判断f不是人脸图像。2.单层感知器和多层感知器神经网络的主要缺陷分别是什么?BP算法的基本思想是什么,存在哪些不足?书254答:单层感知器缺陷:无法解决异或问题,不具备非线性分类能力。多层感知器缺陷:对于一些识别中需要有可靠的拒绝的情况(如身份确定),多层感知器神经网络无法胜任。BP算法其主要思想:从后向前(反向)逐层传播输出层的误差,以间接算出隐层误差。BP算法缺陷:1.有可能陷入局部极小值点,不能保证收敛到全局极小值点。2.训练次数多使得学习效率低下,
4、收敛速度慢。3.隐节点的选取缺乏理论标准。4.训练时学习新样本有遗忘旧样本的趋势。1.试写出两类问题的线性判别函数,并说明函数中各个变量的意义。书84答:两类问题的线性判别函数:x是样本向量,即样本在d维特征空间中的描述,w是权向量,分别表示为:w0是一个常数(阈值权)。2.请简述径向基神经网络和非线性支持向量机的基本思想。pptprnn5-3-SVMP33答:RBF网络的基本思想:1.用RBF作为隐单元的“基”构成隐含层空间,将输入矢量直接(即不需要通过权连接)映射到隐空间2.2.当RBF的中心点确定后,
5、映射关系也就确定3.隐含层空间到输出空间的映射是线性的非线性支持向量机的基本思想:选择非线性映射Φ(X)将x映射到高维特征空间Z,在Z中构造最优超平面课本上:首先通过非线性变换将输入空间变换到一个高维空间,然后在这个新空间中求取最优线性分类面,而这种非线性变换是通过定义适当的内积函数实现的。3.请说明BP算法的基本流程ppt5-2p77答:(1)初始化;(2)输入训练样本对X<=Xp,d<=dp计算各层输出;(3)计算网络输出误差;(4)计算各层误差信号;(5)调整各层权值;(6)检查是否对所有样本完成一次
6、轮训;(7)检查网络总误差是否达到精度要求。流程图:见最后1.监督与非监督模式识别的区别ppt7p5答:监督学习方法必须要有训练集与测试样本。在训练集中找规律,而对测试样本使用这种规律;而非监督学习只有一组数据,在该组数据集内寻找规律;监督学习方法的目的是识别事物,给待识别数据加上标号(label)。因此训练样本集必须由带标号的样本组成。而非监督学习方法只有要分析的数据集本身,没有标号。如果发现数据集呈现某种聚集性,则可按自然的聚集性分类,但不以与某种预先的分类标号对上号为目的;与监督模式识别相比,非监督模
7、式识别问题中存在更大的不确定性。二、计算题1.医生要根据病人血液中白细胞的浓度来判断病人是否患血液病,根据医学知识和以往的经验,医生知道:患病的人,白细胞的浓度服从均值2000,标准差1000的正态分布;未患病的人,白细胞的浓度服从均值7000,标准差3000的正态分布,一般人群中,患病的人数比例为0.5%。一个人的白细胞浓度是3100,试用Bayes决策方法来判断这个是否患血液病。(10分)pptprnn2第51页答:数学表示:Ø用ω表示“类别”这一随机变量,ω1表示患病,ω2表示正常;Øx表示“白细胞浓
8、度”这个随机变量。本例医生掌握的知识非常充分,包括:1)类别的先验分布:P(ω1)=0.5%,P(ω2)=99.5%先验分布:没有获得观测数据(病人白细胞浓度)之前,已知的关于类别的分布(某类事物出现的比例)。2)观测数据白细胞浓度分别在两种情况下的类条件分布:P(x
9、ω1)~N(2000,10002)P(x
10、ω2)~N(7000,30002)样本观测值:x=3100P(3100
11、ω1)=2.1785e-004,
此文档下载收益归作者所有