资源描述:
《应用统计回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十章回归分析回归分析的基本概念一元线性回归多元线性回归1、函数关系y=f(x);2、相关关系Y=f(x,),其中为随机变量。常把上述关系表为:Y=f(x)+——确定性——非确定性相关关系式中最简单、最常用的一种是线性回归,即其中f(x)=L(x)=ax+b的情形.§10.1回归分析基本概念一.相关关系二、一元线性回归的数学模型1、一元线性理论回归模型(10.1.1)其中为确定性部分,0、1为未知参数2、一元线性回归模型对(x,y)作n次独立观察,得n组数据(xi,yi),代入(10.1)得一元线性回归模型(10.1.2)由(xi,
2、yi)的值可作出0、1的估计从而可得上述方程称为一元线性经验回归方程(简称回归方程)参数的最小二乘估计模型线性性的检验预测与控制§10﹒2一元线性回归一、参数的最小二乘估计考虑一元线性理论回归模型(10.2.1)代入(10.2.1)可得一元线性回归模型:若我们对(x,y)做n次独立的观察,可获得n组相互独立的观测值(10.2.3)1.0,1的最小二乘估计先讨论问题:如何由(10.2.2)去估计(10.2.3)中的参数0,1与2。若已得到0,1的估计则线性方程称为一元线性经验回归方程(简称回归方程)。于是对(10.2.2)的每
3、一组观测值,由(10.2.4)均可求得一个相应的值常称为回归值或预测值、拟合值等。我们总希望由估计所定出的回归方程能使一切之间的偏差达到最小,根据最小二乘法的原理,即要求必须满足以下方程组(由微积分)则令用代替,经整理即得(10.2.6)称为正规方程组,在xi,i=1,…,n不全相等时它有唯一解(10.2.7)容易验证,上式中的确能使Q达到最小,因此他们是0,1的最小二乘估计.可见,回归方程的图形是通过点(),斜率为的直线.称此直线为回归直线.(10.2.8)2.最小二乘估计的性质及2的估计令(10.2.9)则(10.2.7)和(10
4、.2.8)可表为:和此时的残差平方和最小,记为Se,称为剩余平方和.即(10.2.12)进一步分析,可得(10.2.13)由于,故很明显,都是统计量,在的假设下,它们具如下性质:(设x0为自变量x的值.)例10.2.1在硝酸钠(NaNO3)的溶解度试验中,测得在不同温度x(0C)下,溶解于100份水中的硝酸钠份数y的数据如下表所示.求0,1的最小二乘估计及2的无偏估计,并写出回归方程.xi0410152129365168yi66.771.076.380.685.792.999.4113.6125.1解编制计算表如下:xi=234yi
5、=811.3n=9xi2=10144yi2=76218.17xiyi=24628.6Lxx=4060Lyy=3084.0543Lxy=3534.8故,可算得2的无偏估计为所求的回归方程为二、模型线性性的检验如果y与x之间不存在良好的线性关系,这样得到的回归方程是毫无意义的。因此,我们必须检验假设H0:1=0;H1:10(10.2.15)离差分解(10.2.17)其中ST称为总离差平方和,称为剩余平方和.由性质(4)知,它的分布仅依赖于n和2,与x的分布无关,因此它反映了除去y与x之间的线性相关关系之外其他因素引起的数据yi间的
6、波动.(10.2.18)称为回归平方和.它主要反映由变量x的变化引起的yi间的波动.由性质(4)知,且与SR独立;在H0真时,由性质(2)及(10.2.18)知故,H0为真时统计量(10.2.19)从而,给定水平,假设H0(10.2.15)有拒绝域易知,在ST一定时,若回归平方和SR越大,则剩余回归平方和Se越小,此时F值就越大,从而反映出y与x之间的线性相关程度就越高,模型(10.2.1)就越好;反之,则相反.以上方法称为模型线性性检验(或回归方程显著性检验)的F检验法.这种检验也需要做方差分析.模型线性性检验方差分析表离差来源平方和自由
7、度F值显著性回归R剩余eSRSe1n2总和STn1回归模型线性性不显著的原因可能有如下几种:(1)影响y的除x外,还可能有其他不可忽略的因素;(2)y与x的关系不是线性的,而是存在其它的关系;(3)y与x无关.为此需要进一步查明原因,视具体情况处理.模型线性性检验的t检验法事实上,当H0真时,于是,给定水平,假设H0(10.2.15)有拒绝域:例10.2.2(续例10.2.1)试判断温度x和硝酸钠溶解份数y之间的线性关系是否显著?选用F检验法.由例10.2.1的计算结果(见P364),并利用(10.2.13)式和(10.2.18)式得建
8、立方差分析表如下.表10-4方差分析表离差来源平方和自由度F值显著性回归R剩余eSR=3077.39688Se=6.6574217F=3235.75总和ST=3