偏最小二乘回归统计分析报告-renkoujiegou

偏最小二乘回归统计分析报告-renkoujiegou

ID:12282389

大小:16.99 KB

页数:3页

时间:2018-07-16

偏最小二乘回归统计分析报告-renkoujiegou_第1页
偏最小二乘回归统计分析报告-renkoujiegou_第2页
偏最小二乘回归统计分析报告-renkoujiegou_第3页
资源描述:

《偏最小二乘回归统计分析报告-renkoujiegou》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、偏最小二乘回归统计分析报告(单因变量——PLS1)一.自变量间相关关系自变量之间存在高度线性相关,采用偏最小二乘回归将显示出其优越性(参见pls1-变量间相关系数表)。二.提取偏最小二乘回归主成份数量您自主提取了5个主成份(参见pls1-确定主成份数量的依据表)。三.提取的主成份对变量的解释能力在偏最小二乘回归计算过程中,所提取的自变量成分th,一方面尽可能多地代表X中的变异信息,另一方面又尽可能与Y相关联,解释Y中的信息。t1的解释能力最强,主成份t1—t5对自变量X和因变量Y的解释能力分别为:103.48%,101.48%(参

2、见pls1-精度分析表)。四.自变量与因变量的相关关系判断自变量集合X与因变量集合Y之间是否存在较强的相关关系是检验是否可以建立Y对X的线性回归的基本条件,如果在图中明显观察到t1与u1之间存在线性关系,则说明X与Y有显著的相关关系,这时采用偏最小二乘回归方法建立Y对X的线性模型才会是比较合理的。自变量与因变量相关系数为0.9094,自变量与因变量存在高度线性相关关系(参见pls1-自变量与因变量相关关系表)。五.自变量在解释因变量时的作用变量投影重要性指标VIPj值,用来测度每一个自变量在系统分析中的作用,即xj在解释Y时作用的

3、重要性。根据用变量投影重要性指标VIPj来测度的每一个自变量对解释因变量的作用大小依次为:x1>x2>x4>x3(参见pls1-自变量在解释因变量时的作用表)。根据VIPj>1即认为xj在解释因变量时具有重要作用的原则,x1,x2在解释y具有重要作用。其中x1在解释y具有最重要的作用六.组间相关关系的结构分析在r(,t1)/r(,t2)关系图上(参见pls1-组间相关关系的结构分析表),如果xj与y两变量的位置十分接近,则认为它们的相关关系相当密切。另一方面,团聚在一起的自变量xj之间,也存在着较强的相关关系,相隔很远的自变量xj

4、之间,由于相关系数较低,可认为是互不影响的独立变量。七.特异点的发现及处理样本数据存在着3个特异点,在样本点i对主成分tm的累计贡献率Ti2表上(参见pls1-Ti2椭圆图与特异点的发现表),清楚地标明了特异点的情况,样本点对成分的累计贡献率过大,大于临界值的点就是特异点。图上看,T2椭圆图椭圆外的点即是特异点。特异点如果是数据本身的结构以及统计错误造成的,通常情况下去掉特异点,会使得数据分析的准确性有很大改善,可以选择pls1—常用统计量表,删除特异点后再做偏最小二乘统计分析,与未删除特异点的原始数据结论在专业上进行比较,以决定

5、特异点的取舍。另外,特异点也可能是技术的飞跃,最佳参数的匹配所致,这种情况下的特异点提供了很有价值的信息,需要认真分析。八.数据重构的质量九.数学模型1.普通最小二乘回归数学模型(仅供比较,偏最小二乘回归分析才是最终结论):y=33.1687+0.3560x1-0.3044x2-0.0067x3-0.0196x4模型复相关系数:R2=0.9308模型F检验值:F=87.3749>F0.05临界值=2.7426,F检验通过,自变量与因变量之间的关系可以用以上模型表示。模型中x1的t检验值在自由度为26下的双尾t分布概率=0.0000

6、<0.05,在置信水平0.05下,t检验通过,x1对y的影响程度显著。模型中x2的t检验值在自由度为26下的双尾t分布概率=0.3904>0.05,在置信水平0.05下,t检验未能通过,x2对y的影响程度不显著。模型中x3的t检验值在自由度为26下的双尾t分布概率=0.2902>0.05,在置信水平0.05下,t检验未能通过,x3对y的影响程度不显著。模型中x4的t检验值在自由度为26下的双尾t分布概率=0.0015<0.05,在置信水平0.05下,t检验通过,x4对y的影响程度显著。2.偏最小二乘回归标准化数据数学模型(含Boo

7、tstrap参数检验及复相关系数R2):需注册根据偏最小二乘回归标准化数据数学模型,可以比较各个自变量在解释因变量时的边际作用。3.偏最小二乘回归原始数据数学模型(最终):需注册4.偏最小二乘与普通最小二乘回归拟合比较:回归拟合比较是指将原始样本数据经偏最小二乘与普通最小二乘回归后得到的回归方程重新对每个点进行预测,并与原始数据的y值进行比较(参见pls1-偏最小二乘与普通最小二乘回归拟合比较)。偏预测绝对误差(

8、偏预测值yi-观测值yi

9、)平均值=98.2804>普预测绝对误差(

10、普预测值yi-观测值yi

11、)平均值=96.341

12、9偏预测相对误差((

13、偏预测值yi-观测值yi

14、)/观测值yi%)平均值=0.2089>普预测相对误差((

15、普预测值yi-观测值yi

16、)/观测值yi%)平均值=0.1967偏预测残差平方和=529490.2808>普预测残差平方和=524580.4

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。