欢迎来到天天文库
浏览记录
ID:43915981
大小:3.45 MB
页数:36页
时间:2019-10-16
《10.2回归分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、直线回归直线回归直线回归的基本概念直线回归方程的建立关于回归系数的估计和假设检验直线回归的统计应用举例例为了研究3岁至8岁男孩人群平均身高(cm)与年龄(year)的规律,在某地区在3岁至8岁男孩中随机抽样,共分6个年龄层抽样:3岁,4岁,…,8岁,每个层抽3名男孩,共抽18名男孩。资料如下:本例的研究目的和实现方法研究目的:了解年龄与儿童人群的平均身高对应关系。方法1:可以做普查,得到每个年龄组所有儿童的身高,并且计算每个年龄组的儿童人群的平均身高。方法2:作抽样调查,本例就是通过按年龄组分层抽样调查,获得样本后用回归分析的方法得到每个年龄组儿童人群的平均身高估计值和并作相应的统计推
2、断。儿童身高的分布特征一般而言,儿童身高满足同一年龄x的儿童身高y近似服从正态分布,因此对于每个年龄x,均有一个身高y的总体均数。不同年龄x的儿童身高分别近似服从对应不同身高总体均数的正态分布。身高的总体均数是年龄x的一个函数画散点图考查身高与年龄的分布关系Y的离散程度与X没有关系,并且散点呈直线带画散点图考查身高总体均数与年龄的关系年龄组的身高样本均数与年龄的散点图由散点图确定身高总体均数与年龄可能是直线关系可以假定固定年龄的身高总体均数与年龄x的关系可能是直线关系,即假定:并且称上述直线方程为(总体)回归方程。Y称为应变量或反应变量,X为自变量,为回归直线的截距参数。为回归直
3、线的斜率回归方程回归方程中,为未知参数,需要用样本资料通过拟合曲线后得到其估计值,并分别记为a和b,相应得到样本估计的回归方程通常称为Y的预测值,其意义为固定x,Y的总体均数的估计值。Y与x的直线回归关系由总体回归方程可知:当=0时,。即:对于x的任何值,总体均数没有任何改变,因此建立Y与x的直线回归方程就没有任何意义了,所以称0时,Y与x之间存在直线回归关系,反之=0Y与x之间称不存在直线回归关系。正态分布性质简述性质1:设Y服从某个正态分布,则Y的总体均数和总体方差2唯一决定了Y的确切分布。性质2:设,令则:回归模型根据上述性质,应用到本例的实际问题:固定年龄X,身
4、高Y服从总体均数为,方差为2的正态分布。2.由散点图可以假定总体均数3.故4.令,5.即:,并称为直线回归模型。误差与残差称为随机误差称为残差(residual)根据上述,直线回归分析要求资料满足固定X,Y服从正态分布等价于残差服从正态分布。直线回归原理示意图所以如果固定x,Y服从正态分布,其散点图呈直线带分布直线回归系数的估计用最小二乘法拟合直线,选择a和b使其残差(样本点到直线的垂直距离)平方和达到最小。即:使下列的SSE达到最小值。由此得到回归系数的意义由总体回归方程可知回归系数表示:x增加一个单位,总体均数增加个单位由于是的估计表达式,所以(样本)回归系数b表示x增加一
5、个单位,样本观察值y平均增加b个单位。回归系数假设检验的必要性由于=0时,,Y与x之间不存在直线回归关系,因此是否为0,涉及到所建立的回归方程是否有意义的重大问题,然而即使=0,样本回归系数b一般不为0(原因?),因此需要对回归系数是否等于0进行假设检验。回归系数的假设检验H0:=0vsH1:0=0.05回归系数的标准误为其中s为残差的标准差则回归系数的检验统计量为回归系数的假设检验可以证明:H0:=0成立时,检验统计量tb服从自由度为n-2的t分布。即:当出现,=0而言这是小概率事件,故可以拒绝H0:=0,认为0。回归系数检验统计量t的分布示意图当
6、t
7、>
8、t0.05,1,n-2时,对=0而言是小概率事件,对>0而言并非是小概率事件。实例计算故实例的回归系数的假设检验H0:=0vsH1:0=0.05t0.05/2,16=2.1209、变异量。线性回归中的方差分析检验为了消除样本量的影响,定义残差的均方和回归的均方如下:,显然X对Y的作用越大,MS回归就越大,MS残差就越小,F就越大,反之,X对Y的作用越小,F就越小。线性回归中的方差分析检验若总体回归系数=0时,F服从自由度为1和n-2的F分布。H0:=0H1:0=0.05当F>临界值F0.05,1,n-2时,可以拒绝H0,认为0。在直线回归中,F检验和t检验是等价的.F检验统计量分布示意图当10、F>F0.05,
9、变异量。线性回归中的方差分析检验为了消除样本量的影响,定义残差的均方和回归的均方如下:,显然X对Y的作用越大,MS回归就越大,MS残差就越小,F就越大,反之,X对Y的作用越小,F就越小。线性回归中的方差分析检验若总体回归系数=0时,F服从自由度为1和n-2的F分布。H0:=0H1:0=0.05当F>临界值F0.05,1,n-2时,可以拒绝H0,认为0。在直线回归中,F检验和t检验是等价的.F检验统计量分布示意图当
10、F>F0.05,
此文档下载收益归作者所有