第二章简单线性回归模型ppt课件.ppt

第二章简单线性回归模型ppt课件.ppt

ID:59235521

大小:312.50 KB

页数:36页

时间:2020-09-26

第二章简单线性回归模型ppt课件.ppt_第1页
第二章简单线性回归模型ppt课件.ppt_第2页
第二章简单线性回归模型ppt课件.ppt_第3页
第二章简单线性回归模型ppt课件.ppt_第4页
第二章简单线性回归模型ppt课件.ppt_第5页
资源描述:

《第二章简单线性回归模型ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三节拟合优度的度量回归线对样本点代表性怎样?——拟合优度一、总方差的分解总离差平方和TSS:回归平方和ESS:残差平方和RSS:TSS=ESS+RSS二、可决定系数公式:性质:范围:【0,1】,越接近1拟合程度越高。对于一元线性回归来说,R2等于Y和X的样本相关系数的平方。R2不仅可以用来评价拟合程度,还可以用来比较不同数据集、不同函数形式、不同解释变量组合的模型。不过,当被解释变量不同时,R2不能比较。当模型中没有截距项,R2可能为负也可能大于1,没有意义。R2表示被解释变量变异中由解释变量解释的部分所占的比例。第四节回归系数的区间估计和假设检验一、统

2、计分布正态分布卡方分布:若x1和x2是自由度分别为n1和n2的独立卡方变量,则:F分布:若x1和x2是自由度分别为n1和n2的独立卡方变量,则:t分布:如果:则:二、几种统计量的抽样分布如果样本则:样本方差为:则有:如果和分别来自两个独立的正态群体和,则有:三、回归系数的区间估计㈠估计抽样分布扰动项方差的估计:残差为的一个估计,且知最小二乘法:则有:n个残差有2个约束条件扰动项的方差为未知证明:则的一个无偏估计为:则方差的估计值为:则有:㈡回归系数的区间估计区间估计:由于抽样随机性,单一估计值可能不同于真值,在统计学中,一个点估计的可靠性由它的标准误来衡量

3、,因此,不能完全信赖一个点估计,而是围绕点估计构造一个区间。概念:是从点估计值和抽样标准误出发,按给定的概率值建立包含待估计参数的区间.其中这个给定的概率值称为置信度或置信水平(confidencelevel),这个建立起来的包含待估计函数的区间称为置信区间(confidenceinterval)。对于t分布,只要自由度及显著性水平确定,就可以通过查表获得。置信区间的含义:重复抽样中,在的概率基础上,构造置信区间100次,从长期看,这些区间将有次包含参数真实值。同理:㈢回归系数的假设检验我们时常对总体参数做一个假设,并且通过样本观测值去推断观测值是否与假定

4、“相符”,当然,“相符”表示“足够相近”。假设:H0备择假设:H1观测值是否与假定“相符”,可从置信区间的角度去考虑,从长期看,置信区间将有包含真实值,因此,H0的假定值若落入置信区间则有的可信性;如果H0的假定值没有落入置信区间,则能以的置信度拒绝H0对于回归系数的显著性检验,一般有:则:若,则有的把握接受原假设;反之拒绝原假设。当时:定义t统计量判断准则:在给定显著性水平下:若,则接受原假设;反之拒绝原假设,认为此时,X对Y有着显著的影响!P值:概念:大到和从样本得到的检验统计量那样大或者更大的概率情形1:情形2:判断准则:在给定显著性水平下:若,则接

5、受原假设;反之拒绝原假设,认为此时,X对Y有着显著的影响!例:研究山西能源消费与经济增长的关系全国能源消费总量(万吨标准煤)XGDP(亿元)Y1978571443645.2171979585884062.5791980602754545.6241981594474889.4611982620675330.4511983660405985.5521984709047243.7521985766829040.73719868085010274.3819878663212050.6219889299715036.8219899693417000.92199098

6、70318718.32199110378321826.2199210917026937.28199311599335260.02199412273748108.46199513117659810.53199613894870142.49199713779878060.83199813221483024.281999133830.9788479.152000138552.5898000.452001143199.21108068.22002151797.25119095.72003174990.31351742004203226.68159586.72005

7、224682184088.62006246270213131.72007265583259258.92008285000302853.4构建模型:回归结果:(6486.101)(0.046069)T=-13.7668427.51471R2=0.963107df=29R2含义:山西地区GDP的总变异,有96.3%由样本回归模型作出解释。总体参数的区间估计:取,则查表得:参数的显著性检验:则拒绝假定,认为X对Y的影响是显著的,平均来说,每消耗一万吨标准煤可导致山西地区GDP增长1.27亿元。注意:截距项表示解释变量X为0时Y的期望值。一般包括以下3个方面:1、

8、真实的截距项2、设定误差的(如省略的变量)的固定影响3、扰动项的均

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。