欢迎来到天天文库
浏览记录
ID:45488292
大小:568.00 KB
页数:39页
时间:2019-11-13
《《模式识别与分类》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、模式识别与分类导言数据预处理无监督方法有监督方法本章作业模式识别与分类导言Clustering/Classification统称如下问题人眼识别物中医看舌苔/脉搏图谱辨别化合物低维与高维数据一次观察的矢量表示n为空间维数,变量数变量即特征各特征类型/量纲/大小相差大模式识别与分类数据预处理值域调整rangescaling自标度化Autoscaling均值0方差1模长模式识别与分类数据预处理标准化Normalization模长为1色谱面积归1质谱最大为1模式识别与分类数据预处理变换法原变量相加/减/除等
2、组合法模式识别与分类数据预处理特征的选择偏差权重法s大的变量更重要Fisher比率法F大的变量更重要模式识别与分类数据预处理协方差矩阵C与相关矩阵R对于n为对象数,p为特征数方差j=1,…,p协方差j,k=1,…,p;j≠k模式识别与分类数据预处理方差-协方差矩阵,简称协方差矩阵如下:对称矩阵模式识别与分类数据预处理相关矩阵如下:其中但对于Autoscaling后的数据,s=1。C即为R。模式识别与分类主成分分析PCA因子分析FA聚类分析clustering无监督方法模式识别与分类PCA得分score载
3、荷loadingd为主成分数模式识别与分类PCA投影判别法数据重构组成互不相关的新变量取较少的主成分数(常为2),完成分类模式识别与分类PCA实例1不同嫌疑人头发中元素的含量(μg/g)样品CuMnClBrI19.20.30173012.03.6212.40.3993050.02.337.20.32275065.33.4410.20.3615003.45.3510.10.50104039.21.966.50.20249090.04.675.60.29294088.05.6811.80.4286743.
4、11.598.50.2516205.26.2原始数据X(9×5)autoscaling计算相关矩阵计算特征值返回模式识别与分类方差百分数主成分数的确定指定,如90%相应的dPCA实例1头发样品中的特征值与方差成分数特征值λ方差%累计方差%13.35267.0567.0521.18223.6590.7030.2855.7096.4040.1352.7099.1050.0450.90100.00特征值>1对于相关矩阵,λ>1的成分为主成分Scree检验nPC在2-3间斜率下降因此d=2合适模式识别与分类得
5、分图主成分图形解释PCA实例13个聚类分属三人t1对t2作图t1最重要模式识别与分类主成分图形解释PCA实例1载荷图l1对l2作图特征在主成分上的投影各变量的相关信息夹角越小,相关性越高高度相关的特征取1即可载荷大小是重要性的度量位于原点的载荷不重要金属间的相关性大于卤素间的Cu与Cl反性相关l1最重要,距原点距离越大,该特征权重越大,Cu模式识别与分类主成分图形解释PCA实例1相似系数或相关系数表CuCu1.000MnMn0.6971.000ClCl-0.950-0.6921.000BrBr-0.5
6、30-0.2330.5881.000I-0.645-0.7490.581-0.084相似系数相关系数Br/I接近正交Cu/Cl负相关1:完全相同0:完全正交自标度化的数据cosα=r模式识别与分类得分图主成分图形解释PCA实例1特征的选择5个全取取Cu/Br/I仍能分类效果略差取Cu/Mn/Cl分类效果差l2无效果3个λ,仅1个>12.57,0.38,0.05一维投影结果原始数据模式识别与分类主成分图形解释PCA实例1双重图biplott1各元素均有贡献t2由Br和I表征Cu/Mn/Cl/I将对象
7、聚为2组Br将对象聚为另2组模式识别与分类PCA实例1应用示例烟叶硅烷化色谱辽宁凤城烟叶不同部位烟叶的区分下部上部中部模式识别与分类FA用少数几个通用因子描述矩阵中的特征抽象因子需经旋转变换成实因子TTFA包含d个因子的特征参数,各因子对应1个起因与对应因子相关的载荷分数由剩余p-d个和通用因子无关的特殊因子构成,如噪声因子模式识别与分类FA目标转换因子分析TargetTransformationFA变换矩阵抽象载荷目标预测目标均值相对偏差relativedeviation估计两者的一致性模式识别与分类
8、FA实例TTFA多环芳烃HPLC-DAD数据有3个重要因子模式识别与分类多环芳烃HPLC-DAD数据FA实例TTFA已知4物的纯光谱但仅3个主因子F补一列模式识别与分类多环芳烃HPLC-DAD数据FA实例TTFA283.331545.91126.4-58.497102.72120.36217.71172.223.665-106.13-223.13-169.66-63.573-628.81-435.2476.663111.23112.8828
此文档下载收益归作者所有