资源描述:
《概率论与数理统计A.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、§9.1回归分析的概念§9.2一元线性回归§9.3可线性化的一元非线性回归§9.4单因素试验方差分析回归分析及方差分析Ch91“回归”一词的历史渊源“回归”一词最早由FrancisGalton引入。十九世纪,英国生物学家兼统计学家高尔顿研究发现:其中x表示父亲身高,y表示成年儿子的身高(单位:英寸,1英寸=2.54厘米)。这表明子代的平均高度有向中心回归的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其它分支中。2§9.1回归分析的基本概念变量之间的关系确定性关系非确定性关系(相关关系)3对变量间统计依赖关系
2、的考察主要是通过相关分析(correlationanalysis)或回归分析(regressionanalysis)来完成的。对于相关关系,虽然不能求出变量之间精确的函数关系式,但是通过大量的观测数据,可以发现它们之间存在一定的统计规律性。4回归分析是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。分为:一元线性回归、多元线性回归、可线性化的非线性归(双曲线、指数、对数、二次、幂函数等)5基本方法考察随机变量Y与普通变量x之间的相关关系.例1.在农业生产中小麦的亩产量Y与所施肥料量x有一定关系,在一定范围内,若施肥量大,
3、亩产也较高。问题:Y是怎样依赖施肥料量x的变化的。问题的特征:x是普通变量,Y是随机变量.处理方法:按数理统计处理问题的方法。6(1)先进行一些试验,分别取不同的值Y也得到个相应观察值得到n对数据对,称为样本数据点(2)散点图Yxo····················7(3)寻找Y与x的数量关系:其中一般地,,8例1合金的强度y(×107Pa)与合金中碳的含量x(%)有关。为研究两个变量间的关系。首先是收集数据,我们把收集到的数据记为(xi,yi),i=1,2,,n。本例中,我们收集到12组数据,列于表1中进行回归分析首先是回归函
4、数形式的选择。当只有一个自变量时,通常可采用画散点图的方法进行选择。9表1合金钢强度y与碳含量x的数据序号x(%)y(×107Pa)序号x(%)y(×107Pa)10.1042.070.1649.020.1143.080.1753.030.1245.090.1850.040.1345.0100.2055.050.1445.0110.2155.060.1547.5120.2360.010为找出两个量间存在的回归函数的形式,可以画一张图:把每一对数(xi,yi)看成直角坐标系中的一个点,在图上画出n个点,称这张图为散点图,见右图。11从散点
5、图我们发现12个点基本在一条直线附近,这说明两个变量之间有一个线性相关关系,这个相关关系可以表示为这便是y关于x的一元线性回归的数据结构式。通常假定在对未知参数作区间估计或假设检验时,还需要假定误差服从正态分布,即显然假定(2)比假定(1)强12由于0,1均未知,需要我们从收集到的数据(xi,yi),i=1,2,…,n,出发进行估计。在收集数据时,我们一般要求观察独立地进行,即假定y1,y2,,yn,相互独立。综合上述诸项假定,我们可以给出最简单、常用的一元线性回归的数学模型:13§9.2一元线性回归1.本节考虑的模型是其中都是未
6、知参数,为回归系数,分别是直线的截距和斜率。称为Y关于x的经验回归函数。方程称为Y关于x的经验线性回归方程,或经验回归方程,其相应的图形称为经验回归直线。此模型称为一元线性回归模型,基于此种模型的统计分析称为一元线性回归分析.142.下面用最小二乘法来求对于自变量x和因变量y的n对观察值的最小二乘估计其中是对观察时的随机误差.的估计。15使得成立的和称为和的最小二乘估计。16于是得方程组17解得,记于是18例9.2.1设某化学过程的得率Y与该过程的温度x有关.现作了10次测量,其数据如下表所示.x/℃384349546066717782
7、88y/%20.420.922.523.024.224.326.226.628.028.9解故于是得线性回归方程19由此给出回归方程为:例2使用例1种合金钢强度和碳含量数据求回归方程。解20,.21残差显然残差的平方和定理9.2.2是的无偏估计。22例:求出例9.2.1中误差方差的无偏估计解例9.2.1中已求出所以23定理9.2.3对一元线性回归模型(9.2.3),若进一步假定随机误差,则有(1).(2)RSS与和相互独立.244回归方程的显著性检验在使用回归方程作进一步的分析以前,首先应对回归方程是否有意义进行判断。如果1=0,那么
8、不管x如何变化,E(y)不随x的变化作线性变化,那么这时求得的一元线性回归方程就没有意义,称回归方程不显著。如果10,E(y)随x的变化作线性变化,称回归方程是显著的。综上,对回归方程是否有意义作判断就