偏最小二乘方法.ppt

偏最小二乘方法.ppt

ID:53565261

大小:591.51 KB

页数:47页

时间:2020-04-20

偏最小二乘方法.ppt_第1页
偏最小二乘方法.ppt_第2页
偏最小二乘方法.ppt_第3页
偏最小二乘方法.ppt_第4页
偏最小二乘方法.ppt_第5页
资源描述:

《偏最小二乘方法.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第六章偏最小二乘方法偏最小二乘方法(PLS-PartialLeastSquares))是近年来发展起来的一种新的多元统计分析法,现已成功地应用于分析化学,如紫外光谱、气相色谱和电分析化学等等。该种方法,在化合物结构-活性/性质相关性研究中是一种非常有用的手段。如美国Tripos公司用于化合物三维构效关系研究的CoMFA(ComparativeMolecularFieldAnalysis)方法,其中,数据统计处理部分主要是PLS。在PLS方法中用的是替潜变量,其数学基础是主成分分析。替潜变量的个数一般少于原自变量的个数,所以PLS特别适用于自变量的个数多于试样个数的情况。在此种情况下

2、,亦可运用主成分回归方法,但不能够运用一般的多元回归分析,因为一般多元回归分析要求试样的个数必须多于自变量的个数。§6.1多元线性回归(MLR)若自变量为m个,xj(j=1,2,…,m),因变量为y,在y与xj间,我们可以建立一线性模型,即(6.1a)(6.1b)(6.1c)在式中,bj为回归系数。在式(6.1)中仅有一个试样,若有n个试样,即为yi(i=1,2,…,n),它的列向量形式为y,b与原来相同,矢量xj’为矩阵X的行,则:y=Xb+e若用图形表示,则为:y=XB+e1m11nnnm在此情况下,n为试样数,m为自变量数。有如下三种情况:(1)m>n,即变量数多于试样数,对

3、于b来说,则有无穷多个解。(2)m=n,变量数与试样数相等,若矩阵X满秩时,则矢量b有唯一解。但是,在实际工作中,这种情况是极少能碰到的。此时我们有:e=y–Xb=0(3)m

4、的解为:(6.3)多元线性回归应用很广泛,因为在许多情况下该种方法具有良好的性能。但是,此种方法也有固有的缺点。假若体系的响应(即因变量)呈现线性,无干扰,无溶液间的相互作用,低噪声无共线性,则多元线性回归是一种非常好的方法。事实上,完全满足上述条件比较困难。当噪声较强,或干扰较严重时,有可能导致所得数学模型失真,如下例:运用式(6.3)则可得B矩阵:所用数学模型有效性的量度可用Err:式中,yik为矩阵Y中第i行第k列的矩阵元,为由矩阵B所得的计算值,ik为前面所介绍的矩阵E的矩阵元。此例中,Err=0.49。若由于噪音使得X增广一列(注意:对于试样浓度的测定,它并不包含有用信

5、息),即:由此得到的B矩阵为:对于此模型,Err=0.07。它比前者为小,这就意味着对于矩阵Y,第二个数学模型比第个要更有效,这是一种假象。由于X中引入最后一列,使得B2中上部3*3部分与前边所提B不相等(B为真实模型)。由B2计算所得Y尽管误差要小,但其数学模型所描述的自变量与因变量间的关系并不真实。其原因主要为多元线性回归方法是采用整个X矩阵来建立数学模型,而并不顾及在X中的信息与真实模型相关与否。很显然,若所得结果偏离了其实际数学模型,则对于未知试样的预测也是错误的。为了克服多元线性回归的不足,在数学方法上引进了主成分回归方法(PCR)。§6.2主成分回归主成分回归可分为两步

6、:测定主成分数,并由主成分分析将X矩阵降维;对于降维的X矩阵再进行线性回归分析。主成分分析的概念在前一章已经作了介绍。所谓主成分,它为一新的变量,而该新变量是原变量xij的线性组合。第一个主成分所能解释原变量的方差量最大,第二个次之,第三个再次之,等等。也就是说,主成分是一种线性组合,用它来表征原来变量时所产生的平方误差最小。运用主成分分析,原变量矩阵X可以表达为得分(即主成分)矩阵T,而T由X在本征矢量P上的投影所得。主成分与矩阵X的本征矢量一一对应,即T=XP。设矩阵X的阶为I*J,若T的阶与J相等,则主成分回归与多元线性回归所得结果相同,并不能显示出主成分回归的优越之处。选取

7、的主成分数一般应该比J小,而删去那些不重要的主成分,因为这些主成分所包含的信息主要是噪声,由此所得的回归方程稳定性较好。另外,由X所定义的空间可以进一步来说明主成分回归与多元线性回归的区别。多元线性回归应用了由X的列所定义的全部空间,而主成分回归所占用的是一子空间。当X的J列中,有一列可为其它J—1列的线性组合时,则X可用J-1列的矩阵T来描述,而并不丢失信息。新的矩阵T定义了X的一个子空间。综合上述,X可由它的得分矩阵T来描述(由于删去与小的本征值相应的维,所以T的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。