资源描述:
《模式识别复习题.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、1、模式识别系统的基本构成单元,并对各单元简要解释数据获取特征提取和选择预处理分类决策分类器设计•数据获取:用计算机可以运算的符号来表示所研究的对象–二维图像:文字、指纹、地图、照片等–一维波形:脑电图、心电图、季节震动波形等–物理参量和逻辑值:体温、化验数据、参量正常与否的描述•预处理单元:去噪声,提取有用信息,并对输入测量仪器或其它因素所造成的退化现象进行复原•特征提取和选择:对原始数据进行变换,得到最能反映分类本质的特征–测量空间:原始数据组成的空间–特征空间:分类识别赖以进行的空间–模式表示:维数较高的测量空间->维数较低的特征空间•
2、分类决策:在特征空间中用模式识别方法把被识别对象归为某一类别–基本做法:在样本训练集基础上确定某个判决规则,使得按这种规则对被识别对象进行分类所造成的错误识别率最小或引起的损失最小2、写出K-均值聚类算法的基本步骤,例子见布置的作业题.算法:第一步:选K个初始聚类中心,z1(1),z2(1),…,zK(1),其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定,例如可选开始的K个模式样本的向量值作为初始聚类中心。第二步:逐个将需分类的模式样本{x}按最小距离准则分配给K个聚类中心中的某一个zj(1)。假设i=j时,,则
3、,其中k为迭代运算的次序号,第一次迭代k=1,Sj表示第j个聚类,其聚类中心为zj。第三步:计算各个聚类中心的新的向量值,zj(k+1),j=1,2,…,K求各聚类域中所包含样本的均值向量:其中Nj为第j个聚类域Sj中所包含的样本个数。以均值向量作为新的聚类中心,可使如下聚类准则函数最小:在这一步中要分别计算K个聚类中的样本均值向量,所以称之为K-均值算法。第四步:若,j=1,2,…,K,则返回第二步,将模式样本逐个重新分类,重复迭代运算;若,j=1,2,…,K,则算法收敛,计算结束。例子:已知{x1(0,0),x2(1,0),x3(0,1)
4、,x4(1,1),x5(2,1),x6(1,2),x7(2,2),x8(3,2),x9(6,6),x10(7,6),x11(8,6),x12(6,7),x13(7,7),x14(8,7),x15(9,7),x16(7,8),x17(8,8),x18(9,8),x19(8,9),x20(9,9)},用K-均值算法进行聚类分析解:选,,第一步:选取第二步:根据聚类中心进行聚类,得到第三步:计算新的聚类中心第四步:因,故回到第二步第二步:根据新的聚类中心重新进行聚类,得到第三步:计算新的聚类中心第四步:,所以算法收敛,得聚类中心为迭代结束。3、最、
5、剪辑、压缩近邻法的基本思想。最近邻法的基本思想:以全部训练样本作为“代表点”,计算测试样本与这些“代表点”,即所有样本的距离,并以最近邻者的类别作为决策。剪辑近邻法基本思想是,利用现有样本集对其自身进行剪辑,将不同类别交界处的样本以适当方式筛选,可以实现既减少样本数又提高正确识别率的双重目的。压缩近邻法:利用现有样本集,逐渐生成一个新的样本集,使该样本集在保留最少量样本的条件下,仍能对原有样本的全部用最近邻法正确分类,那末该样本集也就能对待识别样本进行分类,并保持正常识别率。4、设有6个5维模式样本如下,按最小/大距离准则进行聚类分析(直到分
6、成三个类别为止,距离度量采用欧氏距离)x1:0,3,1,2,0x2:1,3,0,1,0x3:3,3,0,0,1x4:1,1,0,2,0x5:3,2,1,2,1x6:4,1,1,1,0按最大距离准则进行聚类分析:第1步:将每一样本看成单独一类,得计算各类之间的欧式距离,可得距离矩阵000000第2步:矩阵中最大元素为,它是和之间的距离,将他们合并为一个新类为计算聚类后的距离矩阵00000第3步:由于中距离最大者为,它是与之间的距离,于是合并和,得新的分类为同样,按最大距离准则计算距离矩阵,得0000第4步::由于中距离最大者为,它是与之间的距离
7、,于是合并得新的分类为满足聚类要求,如聚为3类,聚类完毕。5、设有5个6维模式样本如下,按最小/大距离准则进行聚类分析(距离度量采用欧氏距离)x1:0,1,3,1,3,4x2:3,3,3,1,2,1x3:1,0,0,0,1,1x4:2,1,0,2,2,1x5:0,0,1,0,1,0用最小聚类准则进行系统聚类分析:第1步:将每一样本看成单独一类,得计算各类之间的欧式距离,可得距离矩阵00000第2步:矩阵中最小元素为,它是和之间的距离,将他们合并为一类,得新的分类为计算聚类后的距离矩阵0000第3步:由于中距离最小者为,它是与之间的距离,于是合
8、并和,得新的分类为同样,按最小距离准则计算距离矩阵,得000第4步:同理得满足聚类要求,如聚为2类,聚类完毕。6、一个三类问题,其判别函数如下:d1(x)=-x1,