欢迎来到天天文库
浏览记录
ID:46285227
大小:545.00 KB
页数:52页
时间:2019-11-22
《第十一讲 简单线性回归》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、简单线性回归Linearregression回归是设法找出变量间在数量上的依存变化关系,用函数表达式表达出来,这个表达式称之为回归方程。两变量间的关系确定性关系:两变量间的函数关系圆的周长与半径的关系:C=2R速度、时间与路程的关系:L=STX与Y的函数关系:Y=a+bX非确定性关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄的关系;身高与体重的关系:标准体重(kg)=身高(cm)-105药物浓度与反应率的关系;一、线性回归的概念当两个变量存在准确、严格的直线关系时,可以用Y=a+bX,表示两者的函数关系。其中X为自变量(independentvar
2、iable);Y是因变量(dependentvariable)。但在实际生活当中,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程来准确反映,为了区别于两变量间的函数方程,我们称这种关系为回归关系,用直线方程来表示这种关系称为回归直线或线性回归。小插曲:为什么叫”回归“?F.GaltonK.Pearson二、回归参数的估计式中的是由自变量X推算应变量Y的估计值,a是回归直线在Y轴上的截距;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y平均变动b个单位。计算原理:最小二乘法,即保证各实测点到回归直线的纵向距离的平方和最小,并使计算出的回归方
3、程最能代表实测数据所反映出的直线趋势。例12-1某医师为了研究正常成年男性的运动后最大心率与年龄的关系,测得20名正常成年男性的有关数据,散点图如下。年龄与运动后最大心率的回归方程回归系数和回归方程的意义及性质b的意义a的意义的意义的意义的意义b的意义斜率(slope)=301.3124-3.218X年龄每增加1岁,其运动后最大心率平均减少3.218(次/分钟)b的单位为(Y的单位/X的单位)b>0,yincreasewiththeincreaseofXb<0,ydecreasewiththeincreaseofXb=0,nolinearcorrelationbetweentwova
4、riables.XYbistheregressioncoefficientandtheslopeoftheline。statisticalsignificanceofb:whenXchangedaunit,theYchangedbunitsonaverage.b>0b<0b=0a的意义a截距(intercept,constant)X=0时,Y的估计值a的单位与Y值相同当X可能取0时,a才有实际意义。估计值的意义X=46时,=153.2844,即年龄为46岁的正常成年男性,其平均运动后最大心率估计值为153.2844(次/分钟);给定X时,Y的估计值。当时,的意义为残差:实测点到回归直
5、线的纵向距离。1112131415165.05.56.06.5残差平方和(residualsumofsquares).综合表示点距直线的纵向距离。在所有的直线中,回归直线的残差平方和是最小的。(最小二乘)的意义三、总体回归系数的假设检验与直线相关一样,直线回归方程也是从样本资料计算而得的,同样也存在着抽样误差问题。所以,需要对样本的回归系数b进行假设检验,以判断b是否从回归系数为零的总体中抽得。总体的回归系数用β表示。一般步骤H0:β=0回归方程无意义H1:β≠0回归方程有意义α=0.05选择合适的假设检验方法(方差分析或t检验),计算统计量计算概率值P做出推论:统计学结论和专业结论
6、方差分析法因变量总变异的分解XP(X,Y)YY的总变异分解未引进回归时的总变异:(sumofsquaresaboutthemeanofY)引进回归以后的变异(剩余):(sumofsquaresaboutregression)回归的贡献,回归平方和:(sumofsquaresduetoregression)Y的总变异分解剩余标准差(1)扣除了X的影响后Y方面的变异;(2)引进回归方程后,Y方面的变异。回归系数检验的基本思想如果X与Y无线性回归关系,在SS回归和SS剩余都是其他随机因素对Y的影响,由此,MS回归≈MS剩余,总体回归系数β=0,反之,β≠0。所以用F检验对X与Y之间有无回
7、归关系进行检验。公式查F界值表,F0.05(1,18)=4.41,F>F0.05(1,18),P<0.05,拒绝H0H0:β=0H1:β≠0α=0.05t检验法Sb是样本回归系数的标准误H0:=0,H1:≠0,=0.05。年龄与运动后最大心率间存在回归关系。决定系数(coefficientofdetermination)取值在0到1之间,反映了回归贡献的相对程度。决定系数除了作为回归拟合效果的概括统计量,还可利用它对回归方程做假设检验。四、回归问题的
此文档下载收益归作者所有