资源描述:
《第6課回歸分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第6章回归分析回归分析是研究变虽之间相关关系的一种统计推断法。例如,人的血压y与年龄x有关,这里x是一个普通变量,y是随机变量。Y与x之间的相依关系f(x)受随机谋差£的干扰使之不能完全确定,故可设有:y=/(%)+£*(6」)式屮f(x)称作回归函数,£为随机课差或随机干扰,它是一个分布与x无关的随机变量,我们帘假定它是均值为0的正态变量。为佔计未知的回归函数f(x),我们通过n次独立观测,得x与y的n对实测数据(Xi,yj)i=l,,n,对f(x)作估计。实际中常遇到的是多个口变量的情形。例如在考察某化学反应时,发现反
2、应速度y与催化剂用虽X],反应温度X2,所加压力X3等等多种因素有关。这里X
3、,X2,……都是可控制的普通变量,y是随机变量,y与诸Xi间的依存关系受随机干扰和随机误差的影响,使之不能完全确定,故可假设有:y=勺,…內)+£(62)这里£是不可观察的随机课差,它是分布与xi,……人无关的随机变量,一般设其均值为0,这里的多元函数f(xh……從讣称为回归函数,为了估计未知的回归函数,同样可作n次独立观察,基于观测值去估计f(xb……,xk)0以下的讨论中我们总称自变量xm……,Xk为控制变量,y为响应变量,不难想象,如对回归
4、函数f(X
5、,……,Xk)的形式不作任何假设,问题过于一般,将难以处理,所以本章将主要讨论y和控制变量xbx2,……,Xk呈现线性相关关系的情形,即假定f(x1,,Xk)二b()+bIx]++bkxkl并称山它确定的模型6」(k=l)及6.2为线性回归模型,对于线性回归模型,估计回归函数f(xh,Xr)就转化为估计系数b。、bi(i=l,,k),当线性回归模型只冇一个控制变量时,称为一元线性回归模型,冇多个控制变量时称为多元线性回归模型,木着由浅入深的原则,我们重点讨论一元的,在此基础上简单介绍多元的。第一节一元线性回归一
6、、一元线性回归的数学模型。前ifii我们曾提到,在一元线性回归中,冇两个变量,其屮x是可观测、可控制的普通变量,常称它为自变量或控制变量,y为随机变量,常称其为因变量或响应变量。通过散点图或计算相关系数判定y与xZ间存在着显著的线性相关关系,即y与x之间存在如下关系:y=a+bx+£(6.3)通常认为E〜MO,o2)且假设。2与x无关。将观测数据仪心)(口,……,n)代入(6.3)再注意样木为简单随机样木得:cyi=a+hxi+Ei(z=l,•••,/!)…独立同分布N(0q2)称(6.3)或(6.4)(又称为数据结构式)
7、所确定的模型为一元(正态)线性冋归模型。对其进行统计分析称为一元线性回归分析。不难理解模型(6.3)中EY=a+bx,若记y=E(Y),则y=a+bx,就是所谓的一元线性回归方程,其图象就是回归直线,b为回归系数,a称为回归常数,有时也通称a、b为回归系数。我们对一元线性回归模型主要讨论如下的三项问题:⑴对参数a,b和八进行点估计,估计最称为样木回归系数或经验回归系数,而y=a+bx称为经验凹归直线方程,其图形相应地称为经验回归直线。(2)在模型(6.3)下检验y与xZ间是否线性相关。(3)利用求得的经验回归直线,通过x对
8、y进行预测或控制。二、a、b的最小二乘估计、经验公式现讨论如何根据观测值(Xi,yd,i二1,2,,n估计模型(6.3)中回归函数f(x)=a+bx中的回归系数。采用最小二乘法,记平方和Q(a,b)=》(片-a-bx,)2(6.5)/=1找使Q(a.b)达到最小的a、b作为其估计,即Q(a9b)=minQ(a,b)a.b孚=2为x—a一処]=02a青为此,令V…
9、^=2£(开-。-九)為=0化简得所示的方程组(称为模型的正规方程)Lb=—解得{Lxx(6.6)/—a=y=bx(6.6)所示的分别称为a、b的最小二乘估计
10、,式屮5=£6-才=1>2-丄(1>)2/=1/=1ni=川__”1H川Lxy二工a-兀)(x-y)=X兀x一一(X兀)(工x)i=l/=1n11称y=a+bx为经验冋归(直线方程),或经验公式。例1某种合成纤维的强度与其拉伸倍数冇关。下表是24个纤维样品的强度与相应的拉伸倍数的实测记录C试求这两个变最间的经验公式。编号1234567891()1112拉伸倍数X1.92.02.12.52.72.73.53.54.04.04.54.6强度y(Mpa)1.41.31.82.52.82.53.02.74.03.54.23.5编
11、号131415161718192021222324拉伸倍数X5.05.26.06.36.57」8.08.08.96.06.510.0强度y(Mpa)5.55.05.56.46.05.36.57.08.58.08」&1将观察值(Xi,Yi),i=l,……,24在平而直角处标系下用点标岀,所得的图称为散点图