欢迎来到天天文库
浏览记录
ID:51455596
大小:1.32 MB
页数:36页
时间:2020-03-23
《偏最小二乘回归方法.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、偏最小二乘回归方法讲演人:简言之偏最小二乘回归是一种集多元线性回归分析、典型相关分析和主成分分析的基本功能为一体的新型多元统计分析方法。此方法的优点:(1)能在自变量存在严重多重相关性的条件下进行回归建模;(2)允许在样本点个数少于自变量个数的条件下进行回归建模;此方法的优点:(3)偏最小二乘回归在最终模型中将包含原有的所有自变量,易于辨识系统信息与噪声,而且其自变量的回归系数也将更容易解释。此方法的优点:(4)偏最小二乘回归方法与其他的建模方法相比,具有计算简单、预测精度高,易于定性解释的优点。多因变量偏最小二乘算法推导首先将数据做标准化处理。原自变量数据表经
2、标准化后的数据矩阵记为原因变量数据表经标准化后的数据矩阵记多因变量偏最小二乘算法推导第一步:记是的第一个成分,,是的第一个轴,它是一个单位向量,即有。记是的第一个成分,是的第一个轴,它是一个单位向量,即。多因变量偏最小二乘算法推导如果要使,能很好的代表与中的数据变异信息,根据主成分分析原理,应该有,。多因变量偏最小二乘算法推导另一方面,由于回归建模的需要,又要求对有最大的解释能力,由典型相关分析的思路,与的相关度应达到最大值,即多因变量偏最小二乘算法推导因此,综合起来,在偏最小二乘回归中,我们要求与的协方差达到最大,即多因变量偏最小二乘算法推导正规的数学表述应该
3、是求解下列优化问题,即多因变量偏最小二乘算法推导采用拉格朗日算法,记对分别求关于,,和的偏导数,并令之为零,有多因变量偏最小二乘算法推导(1)式(2)式(3)式(4)式多因变量偏最小二乘算法推导由上述四个式子可以推出记,所以正是优化问题的目标函数值。多因变量偏最小二乘算法推导把(1)和(2)式写成将(6)代入(5),有(5)式(6)式(7)式多因变量偏最小二乘算法推导同理,可得易知,是矩阵的特征向量,对应的特征值为。是目标函数,它要求取最大值。所以,是对应于矩阵的最大特征值的单位特征向量。多因变量偏最小二乘算法推导易知,是对应于矩阵的最大特征值的单位特征向量。求
4、得轴和后,即可得到成分,。然后,分别求和对与的三个回归方程多因变量偏最小二乘算法推导其中多因变量偏最小二乘算法推导而,,分别是三个回归方程的残差矩阵。多因变量偏最小二乘算法推导第二步:用残差矩阵和取代和。然后,求第二个轴和以及第二个成分,,有多因变量偏最小二乘算法推导是对应于矩阵的最大特征值的特征向量;是对应于矩阵的最大特征值的特征向量。多因变量偏最小二乘算法推导计算回归系数因此,有回归方程(8)式多因变量偏最小二乘算法推导如此计算下去,如果的秩是,则会有由于均可以表示成的线性组合。多因变量偏最小二乘算法推导因此,(8)式还可以还原成关于的回归方程形式,即是残差
5、矩阵的第列。偏最小二乘回归的简化算法(1)求矩阵最大特征值所对应的单位特征向量,求成分,得其中偏最小二乘回归的简化算法(2)求矩阵最大特征值所对应的单位特征向量,求成分,得其中……偏最小二乘回归的简化算法至第h步,求成分,是矩阵最大特征值所对应的特征向量。如果根据交叉有效性,确定共抽取h个主成分可以得到一个满意的预测模型。偏最小二乘回归的简化算法则求在上的普通最小二乘回归方程为其中交叉有效性具体的步骤:记为原始数据,是在偏最小二乘回归过程中提取的成分,是使用全部样本点并取h个成分回归建模后,第个样本点的拟合值,是在建模时删除样本点,交叉有效性具体的步骤:取h个成
6、分回归建模后,再用此模型计算的的拟合值,记交叉有效性具体的步骤:当即时,引进新的成分会对模型的预测能力有明显的改善作用。典型相关分析中的精度分析在偏最小二乘回归计算过程中,所提取的自变量成分,尽可能多地代表中的变异信息。对某自变量的解释能力为典型相关分析中的精度分析对某因变量的解释能力为对的解释能力为对的解释能力为对的解释能力为典型相关分析中的精度分析对的解释能力为对的解释能力为谢谢!讲演人:汤佳佳
此文档下载收益归作者所有