欢迎来到天天文库
浏览记录
ID:37383346
大小:1.09 MB
页数:33页
时间:2019-05-10
《《般线性回归分析》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、六西格玛绿带培训教材一般线性回归分析11-1结束对本章节的学习后,学员将可以:◆解释什么是回归分析◆进行一般线性回归分析与解释●假设●测定系数(R2与修正的R2)●回归诊断●置信区间●有影响的观测数据●估计标准误学习目的定义:回归是确定一个响应变量(或输出)与一个或多个因变量(或输入)之间的统计关系的方法。Y=f(X1,X2,…Xn)回归分析其中:Y是响应变量X1到Xn是因变量11-2定义:决定两个来自不同变量源的响应(或输出)之间线性关系的方法。也代表两个变量间的线性关联程度。由一个相关系数(R)来衡量两个变量间
2、的联系强度,在这里-1≤R≤1。按照惯例,R表示真实的系数,R表示我们的最佳估算。相关^回归分析回归分析建立关于因变量与响应变量之间关系的估计方程式(公式)。回归与相关相关分析量化两个变量之间的线性关系的程度,即等式的适合性如何?VS11-3◆预测◆系统模型◆因子筛选◆参数估算回归的应用一般线性回归(SLR)数学模型其中:一般线性回归Y-轴上的截取值预测(独立)变量Y=a+bX斜率是响应(非独立)变量11-4最小平方的方法残差(或误差)由e1=Yi-(a+bXi)表示。(观测值-拟合值)最适合的直线即是残差平方和
3、最小的那条线。最小平方的方法11-5在Minitab中,可通过以下两种方法得到一般线性回归模型(最佳拟合线):统计>回归>回归统计>回归>拟合线图例1某黑带想了解一化学蒸馏过程中氧气的纯度(Y)与冷凝器中的炭氢化合物%之间的关系。◆数据在文件Oxygenpurity.mtw中。◆建立Oxygenpurity.mtw对Hydrocarbon%(X)之间的一般线性回归模式。例1AMinitab统计→回归→回归11-6例1A:Minitab的对话窗口◆回归分析:Oxygenpurity%与Hydrocarbon%◆回归方
4、程为Oxygenpurity%=74.3+14.9+Hydrocarbon%◆系数标◆自变量系数准误TP◆常量74.2831.59346.620.000◆Hydrocarbon%14.9471.31711.350.000◆S=1.08653R-Sq=87.7%R-Sq(调整)=87.1%◆方差分析◆来源自由度SSMSFP◆回归1152.13152.13128.860.000◆残差误差1821.251.18◆合计19173.38与Hydrocar的关系解释了y值87.7%的变异。F检验显示测定系数87.7%,具备统计
5、显著性。整体显著性在Minitab中P数值是对回归等式的整体显著性的测量P-value<0.05表示在统计上回归关系显著R2=87.7%P-value=0.000回归关系所表达的Y的变异的87.7%在统计上是显著的。例1BMinitab统计>回归>拟合线图11-8例1B:拟合线图例2:残差分析从文件Oxygenpurity中,建立Oxygenpurity对Hydrocarbon%(X)之间的一般线性回归模式并进行残差分析11-9例2:Minitab的残差图表例2:Minitab的残差图表11-10随机正态性正态且均
6、值为0随机置信区间置信区间(CI)◆对于一个给出的X,Y的平均值的分布区间。该区间在X=X处最窄:X值离X越远其区间宽度越大。预测区间(PI)◆对于与一个给出的X值相应的个别的Y值的区间。由于其应用个体值,该区间比置信区间宽。例3从文件Oxygenpurity.mtw中,测定对已获得的线性回归模型的95%置信区间和预测区间。11-11Minitab例3Minitab统计→回归→拟合线图例3:Minitab的CI—PI图11-12利用回归模型进行预测我们可以预测两个数:给出X值,预测y的均值uy给出X值,预测y数值我
7、们不可以用此模型预测数据范围以外的uy或y。此模型只是在数据范围内才被验证为有效。例4:预测从文件Oxygenpurity.mtw中,给定X的值为1.15,确定uy和y的95%区间。11-13例4:预测Minitab统计→回归→回归例4:Minitab输出新观测值的预测值新观家拟合值测值拟合值标准误95%置信区间95%预测区间91.4730.250(90.947,91.999)(89.130,93.815)新观测值的自变量值新观测值Hydrocarbon%11.1511-14具有影响的数据点具有影响的数据点包括下列
8、现象:1.在正常数据模式以外的数据;2.强烈影响回归结果的数据(也就是显著改变斜率或y轴截取值)这些现象并不一定是坏现象,因此你不一定要删除他们。不管怎样,并在分析回归结果之前应该识别这些数据点并评估其影响。具有影响的数据点具有影响的数据可由于下列原因而被删除:◆测量误差◆数据输入误差◆违反物理定律包含明显的虚假值的回归方程式会被视为无效!11-15具有影响
此文档下载收益归作者所有