资源描述:
《回归和相关性分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、相关和回归分析相关分析概述相关分析是一种常用的揭示变量之间相互关系的分析方法,我们知道产品、过程、服务等质量存在波动性和规律性,质量管理就是要揭示质量随过程变量变化的规律。发现最关键的少数变量并加以改善和控制.使过程保持在相对稳定的高水平上。六西洛玛管理法正是一种基于数据.以客户要求为驱动的质量管理系统,所以利用相关、回归等分析方注寻找影响质量的关键因素是六西格玛突玻策略中分析阶段的主要任务。相关和回归分析在六西格玛突破模式各阶段的作用从下图可看出,相关和回归分析在六西括玛突破策略的分析阶段可以验证输入输出结果间关系的真实性即原因的真实性并确定“关键的
2、少数因素”。这是六西格玛分析阶段的主要任务。在控制阶段,相关和回归分析法可以根据输入的变化对输出结果进行预测从而确定是否对输入进行调整。相关和回归分析的作用验证原因的真实性确定关键数变量对结果进行预测六西格玛突破策略鉴别优化测量分析改善控制相关分析概述变量间的相关性某工艺工程师想研究松香比重对焊点拉拔里的影响,测得一组数据如下:仔细观察这组数据,我们会发现一个规律,当松香比重提高时,焊点拉拔力也会相应提高,这表明焊点拉拔力和松香比重间存在一种关系,我们称松香比重和焊点拉拔力间存在相关关系.散布图散布图是将一对变量用图形表示出来,两个变量分别对应于上图的
3、X和Y坐标轴,这样每对对应的X、Y数据均可在散布图上以一个点来表示.观察散布图的形状即可以了解变量X和Y的相互关系.上例松香比重和焊点拉拔力的关系可用散布图表示如下:本散布图中的lO个点的坐标分别是:(O.760,5.1)(0.785,6.8)(0.780,6.2)(0.770,5.9)(0.820,7.5)(0.765,5.0)(O.815,7.0)(O.788,6.9)(O.790,7.1)(0.769,5.9)以上坐标和松香比重与焊点拉拔力数据一一对应。从上面的散布图上.我们可以看到一个规律:数据分布呈一条细带型(在一个带型范围内);从图的左下角
4、延期伸至右上角。但通过上图我们所能了解的信息是很粗略的,怎样才能将x和y之间的这种相关关系量化呢,有无一个参数来衡量x和v之间相关的程度昵?有,这就是我们将要讨论的相关系数。相关系数相关系数是用来描述变量x和y之间线性相关程度的参数用r来表示,它具有以下特性.r的值介于(-1,1)之间.r的绝对值越接近1表示x和y之间的线性关系越密切.r>0,x和y呈正相关,r<0,x与y呈负相关,r=0,x与y之间无线性相关关系.r的计算公式其中:因为r=0.88较大,故认为松香比重和焊点拉拔力之间存在较强的正相关关系.散布图形状与相关系数的对应关系散布图可直观观察
5、变量间的相互关系,但无法量化.相关系数r可以精确量化x和y的相关关系.如果将二者对应起来,即可以通过散布图获取更多的较为准确的信息.下面是几种常见散布图和对应的相关系数.结果相关系数的几个特性及上面的散布图可对变量间的相关关系有较深入的理解.一元线回归分析概述通过相关分析可以确定变量间的相关性及相关程度,在解决实际问题时,仅做到这一步是不够的。因为我们分析的目的是发现主要因素并找到其影响规律。即随着“关键的少数因素”的变化量为多少?回归分析就是用来定量描述因素x和因变量y间关系的方法。通过回归分析,我们可用方程来表示x和y的关系。从而发现y随x的变化规
6、律。在六西格玛管理法的突破案略中,回归分析是强有力的工具,它可以筛选潜在的少数x,对y进行预测和优化及确定对应于y的最优值的x的水平设置。一元性线回归模型一元性线回归方程在本章第一节的例子中,我们做出的散布图如下:从上面的散布图可看出,数据点大都分布在一条直线附近,由此可知松香比重(x)和焊点拉拨力(y)之间大致可认是线性关系,但同时这些点又不在一条直线上,这说明x与y的关系未确定到给定x就可唯一地确定出y的程度,即x与y之间不是函数关系.因为除了松香比重外,还有其它因素如预热温度、焊点温度、焊锡成分等对焊点拉拔力产生重要影响.还有部分随机因素如环境温
7、度湿度等也作用于y,如果我们只研究松香比重(x)和焊点拉拔力(y)二者之间关系,可甚量设出以下直线关系。y=a+bx+c其中:a、b称为回归系数b为直线斜率a为Y截距e为模型的误差项。代表随机误差。用这个关系式确定的直线我们称作图因变量y的回归方程它量化了y于x之间的关系,本例的直线作于散布图上如下:从上图可以看出,归直线代表了x和y之间最接近的关系,即通过直线模型,以x里预测y时误差最小.回归方程中直线斜率b和Y截距a的计算假设为一组数据,须用回归方程对x和y的关系进行描述,当x=.时y。的估计值为上式中,我们希望求出的a和b的值能使在组中所有点上,
8、y的估计值与其实际观测值y最接近,即我们需确定一条使组中所有点都与其比较接近的直线。这条直线的