资源描述:
《模式识别03-聚类分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、模式识别导论——聚类分析李金屏济南大学信息科学与工程学院模式识别与智能系统研究所山东省网络环境智能计算技术重点实验室2011年9月2021/9/17济南大学模式识别与智能系统研究所(R)2目录复习说明模式相似性测度类的定义、类间距离和聚类准则聚类算法总结和作业2021/9/17济南大学模式识别与智能系统研究所(R)3目录复习说明模式相似性测度类的定义、类间距离和聚类准则聚类算法总结和作业2021/9/17济南大学模式识别与智能系统研究所(R)4复习模式识别的基本过程为什么要进行特征提取?什么是特征?如何抽取和表示特征?识别和训练(两种训练方式)识别系统的性能评价特征矢量的特点:随机性(为
2、什么?)随机矢量的数字特征:有哪些?什么是正态分布(高斯分布)?写出一维和二维情况下的具体表达式和每个符号的具体含义。2021/9/17济南大学模式识别与智能系统研究所(R)5复习根据模式识别的基本过程,讨论如何区分正常的楼房维修和爬楼盗窃?Key:维修:一般白天;安全工具;工作服;长时停留;有灯光等盗窃:一般夜间;主要徒手;夜行衣;不逗留;无灯光等当然前提是能够检测到移动目标和判定大小如何区分这两种水果(自动分拣机):梨和桃子?Key:梨:青或黄;无沟;粗糙多斑点;尾桔蒂等桃:红或青;有沟;光滑少斑点;尾多尖等2021/9/17济南大学模式识别与智能系统研究所(R)6目录复习说明模式相
3、似性测度类的定义、类间距离和聚类准则聚类算法总结和作业2021/9/17济南大学模式识别与智能系统研究所(R)7说明特征的选取特征选取要合适特征选取不足有可能将不同类别判为一类特征过多可能有害无益假设根据已有特征已经能够正确分类新增加的特征与原有特征的关系:独立、不相关或者相关若独立或者不相关,则分类结果不变,但是增加负担;若相关,增加冗余;则重要特征占“比重”减少;导致误判增加和负担增加量纲要合适2021/9/17济南大学模式识别与智能系统研究所(R)8目录复习说明模式相似性测度类的定义、类间距离和聚类准则聚类算法总结和作业2021/9/17济南大学模式识别与智能系统研究所(R)9模式
4、相似性测度为了能够划分模式的类别,必须首先定义相似性测度,描述各个模式之间特征的相似程度。距离测度描述两个矢量x和y之间的距离d(x,y)应该满足如下公理:d(x,y)0,d(x,y)=0iffx=y;d(x,y)=d(y,x);d(x,y)d(x,z)+d(z,y);需要说明,某些距离测度不满足公理3,只是在广义上称为距离。2021/9/17济南大学模式识别与智能系统研究所(R)10模式相似性测度距离测度设x=(x1,x2,…,xn)T,y=(y1,y2,…,yn)T欧式距离(Euclidean)d(x,y)=
5、
6、x-y
7、
8、=[i=1n(xi-yi)2]1/2绝对值距离(Manh
9、attan距离)d(x,y)=i=1n
10、xi-yi
11、切氏距离(Chebyahev)d(x,y)=maxi
12、xi-yi
13、闵科夫斯基距离(Minkowski)d(x,y)=[i=1n(xi-yi)m]1/mm=2,1,时分别是欧式距离、绝对值距离和切氏距离。2021/9/17济南大学模式识别与智能系统研究所(R)11模式相似性测度距离测度马氏距离(Mahalanohis)设n维矢量xi和xj是矢量集{x1,x2,…,xn}中的两个矢量,其马氏距离d是:d2(xi,xj)=(xi-xj)TV-1(xi-xj)2021/9/17济南大学模式识别与智能系统研究所(R)12模式相似性测度距离测
14、度Camberra距离(Lance距离、Willims距离)能克服量纲引起的问题,但无法克服分量间的相关性。2021/9/17济南大学模式识别与智能系统研究所(R)13模式相似性测度相似测度设x=(x1,x2,…,xn)T,y=(y1,y2,…,yn)T角度相似系数(夹角余弦)对于坐标系的旋转和尺度缩放是不变的,但对于一般的线性变换和坐标系的平移不具有不变性。指数相似系数不受量纲变化影响。其中i2为相应分量的方差。2021/9/17济南大学模式识别与智能系统研究所(R)14匹配测度有时特征只有两个状态,即二值特征。令a=ixiyi,b=I(1-xi)yi,c=Ixi(1-yi),
15、e=I(1-xi)(1-yi)Tanimoto测度模式相似性测度Rao测度2021/9/17济南大学模式识别与智能系统研究所(R)15拓展思维其他的匹配测度?相同特征的比例?即(1-1)和(0-0)在所有特征中占有的比例相同特征与不同特征的比例?模式相似性测度一个问题:特征空间中,两个特征矢量分别如下,计算其间不同距离:x=(1,1,0,1,0,0)T,y=(1,0,0,1,0,1)Tx=(180,75,50)T,y=(170,7