欢迎来到天天文库
浏览记录
ID:40040380
大小:582.50 KB
页数:68页
时间:2019-07-18
《主成分分析理论介绍及举例》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、吴海龙湖南大学化学生物传感与计量学国家重点实验室E-mail:hlwu@hnu.net.cn主成分分析PrincipalComponentAnalysisChemometrics?Thechemicaldisciplinethatusesmathematical,statisticalandothermethodsemployingformallogic(i)todesignorselectoptimalmeasurementproceduresandexperiments,and(ii)toprovide
2、maximumrelevantchemicalinformationbyanalyzingchemicaldata.一次测量得到一个值例如:温度、压力、pH、单波长的吸光度等单变量数据分析仪器的高性能化例如:UV-可见分光吸收光谱IR、NIR、荧光光谱GC、LC、MSNMR、等样品-浓度数据样品-变量-时间等等多变量数据分析过程测定-----得到数据-----数据解析------信息----结论=====================================单变量(矢量型数据):平均值、标准差、数
3、据检验、。。。。多变量(矩阵型数据):主成分分析(抽象因子分析,数据简约)、聚类分析、方差分析、。。。。。。变量组合:(矢量-矢量、矢量-矩阵、矩阵-矩阵)多元线性回归、典型相关分析、主成分回归、。。。偏最小二乘回归分析化学中常用方法定性分析:分类、判别定量分析:工作曲线法、多元校正、QSAR、。。。建模:Ys=XsB+E,如:Rs=CsS’+Es.已知:Rs、Cs,求:S.预测:Yu=XuB+E,如:Ru=CuS’+Es.已知:Ru、S,求:Cu.1PrincipalComponentAnalysis
4、(PCA)主成分分析(PCA)对一个矩阵,利用其变量之间的共线性,对数据进行简约。这样,可直观显示(图示)可提取抽象因子有效克服因严重共线性引起的不稳定算法带来的计算误差放大,即病态PCA例子#BTBmcTmc14826131224420963402451043818345329-3-56286-7-87265-9-98244-11-10mean351400B:苯,T:二甲苯;Bmc和Tmc为减去平均值后的值利用GC得到的8个样品中苯和二甲苯的含量TmcvsBmcX矩阵中含有8个样品和两个变量方差协方差阵为
5、:77.7176.2976.2980.86也即,它使用平均化的X矩阵XTX(列数-1)特征矢量#特征值B的系数T的系数方差百分数1155.590.69980.714498.12.980.7144-0.69981.9方差=/(样品数-1)PCA方差协方差矩阵夹角余弦cos(ij)=(xikxjk)/(xik2xjk2)相关系数cos(ij)=[(xik-mi)(xjk-mj)]/((xik-mi)2(xjk-mj)2)其中mi和mj分别表示第i和第j个样本的均值.PCA计算特征
6、矢量t=x1p1+x2p2(p12+p22)=1p=(p1,p2)t约束条件极大极小化,使用Lagrange乘子法,I为2x2的单位阵PCA得到特征值:(77.71-155.59)p1+76.29p2=076.29p1+(80.86-155.59)p2=0p1=0.6998p2=0.7144p1=0.7144p2=-0.6998Lamda:12155.58762.9838Eigenvector:0.69980.71440.7144-0.6998特征矢量1和2特征值与特征矢量特征值与特征矢量相关连,表示方差的
7、程度特征矢量是根据方差最大化原理进行原始数据的变量的线性组合得到的特征矢量的方差比前一个特征矢量的更小,也就是依次递减此时,特征矢量相互正交,也就是无相关性PCA的术语特征矢量又可以叫做载荷轴、主成分、潜变量、抽象因子所谓得分就是原始数据在主成分轴上的投影,也就是下一个图中第一主成分上的圈PC1和PC2的表示PCA的优点它能找到表现原始数据阵最重要的变量的组合通过表示最大的方差,能有效的直观反映样本之间的关系能从最初的几个主成分的得分来近似反映原始的数据阵用PC1对X阵近似#BapproxTapproxBm
8、cTmcScore1.12.3612.62131217.672.7.417.569610.583.7.457.6051010.644.3.473.54344.965.-3.97-4.05-3-5-5.676.-7.43-7.58-7-8-10.617.-8.91-9.09-9-9-12.738.-10.39-10.60-11-10-14.84用PC1对X阵近似(77.71-155.59)p1+76.29p2=07
此文档下载收益归作者所有