欢迎来到天天文库
浏览记录
ID:45098506
大小:15.87 KB
页数:3页
时间:2019-11-09
《MATLAB中PLS算法模型和函数》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、MATLAB中PLS算法的实现数学模型:MATLAB中用plsregress函数实现的偏最小二乘回归,该函数用的是一种简化的偏最小二乘算法,其数学模型如下:得分、载荷向量(主成分系数)、和中心化变量X0、Y0之间的关系是:XL=X0’*XS;YL=Y0’*XS;其中,XS=X0*W,W跟X0’*Y0的奇异值分解有关系,XL、YL是X0、Y0在XS上的回归系数,YS的初始计算公式是:YS=Y0*YL=Y0*YO’*XS;之后,迭代的,根据XS的前一列正交YS的每一列,使得XS’*YS是下三角矩阵。XS*XL’和XS*YL
2、’与X0和Y0近似相等,即可以得到如下分解公式:光谱数据的分解:X0=XS*XL’;组分数据的分解:Y0=XS*YL’;实现偏最小二乘回归要建立Y0与X0之间的关系,将上边两个等式联系起来的桥梁是:YS=X0*CC可以看成是X空间X0在Y得分空间YS上的投影。这样通过公式的推导:YS=XS*XL’*C;XS=YS*(XL’*C)-1;Y0=YS*(XL’*C)-1*YL’=X0*C*(XL’*C)-1*YL’;令B=C*(XL’*C)-1*YL’;则Y0=X0*B;就建立了组分值与光谱数据之间的关系。算法实现:从以上数
3、学模型中看出,需要光谱数据和组分数据的分解并通过回归最终建立起两者之间的联系,但在实际的算法中是通过迭代一步实现的,PLS同时执行光谱数据和浓度数据的分解,也并不像PCR算法中有单独的回归步骤,。计算这个模型的每一个新载荷向量时,在这个因素所起的作用从原始数据移除前得分就被替换掉了,缩减了的数据矩阵用来计算下一个载荷向量,过程重复直到所有期望的载荷向量计算完。相关参数说明:Plsregress函数输入光谱数据X、组分数据Y以及主成分个数ncomp,输出光谱数据载荷向量XL,得分XS,组分数据载荷向量YL,得分YS,回归
4、系数BETA,方差解释百分比PCTVAR,平均平方误差估计MSE,和包含一些信息的结构体stats。下边对各变量一一说明:X是n*p维,Y是n*m维,Plsregress运用SIMPLS算法时首先对X、Y进行中心化处理得到X0、Y0,没有进行标准化处理。XL是p*ncomp维,YL是m*ncomp维。XS是n*ncomp维正交矩阵,是主成分,是X0中变量的线性组合,行对应样本,列对应主成分。YS是n*ncomp维,是使得XS有最大协方差的组分值的线性组合,行对应样本,列对应主成分,YS既不是正交的也不是标准化的。BET
5、A是(p+1)*m维的,在第一行包含的是截距项,回归系数、光谱数据、组分数据之间有以下公式:Y=[ones(n,1),X]*BETA+RESIDUALS;Y0=X0*BETA(2:end,:)+RESIDUALS;PCTVAR是2*ncomp维的,第一行表示每个主成分解释的X中方差的百分比,第二行表示每个主成分解释的Y中方差的百分比。MSE是2*(ncomp+1)维的,表示对0:ncomp个主成分估计PLS模型的平均平方误差,第一行是X中的,第二行是Y中的。可以通过参数设定来选择计算MSE的方法。Stats中w是PLS
6、模型中一个p*ncomp维的权重矩阵,满足XS=X0*W;T2是对XS中每个点的一个T^2测量;Xresiduals是光谱残差:X0-XS*XL’;Yresiduals是组分残差:Y0-XS*YL’,它等于用回归系数得出的回归残差,即Y-[ones(n,1),X]*BETA。
此文档下载收益归作者所有