多元线性回归模型检验及stata软件应用

多元线性回归模型检验及stata软件应用

ID:40183225

大小:687.00 KB

页数:48页

时间:2019-07-24

多元线性回归模型检验及stata软件应用_第1页
多元线性回归模型检验及stata软件应用_第2页
多元线性回归模型检验及stata软件应用_第3页
多元线性回归模型检验及stata软件应用_第4页
多元线性回归模型检验及stata软件应用_第5页
资源描述:

《多元线性回归模型检验及stata软件应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章多元线性回归模型检验拟合优度检验方程的显著性检验(总参数的F检验)变量的显著性检验(单参数的t检验)构造置信区间3.2拟合优度检验可决系数与调整的可决系数1.总离差平方和的分解观测值对均值的分散程度、偏离程度拟合值对均值的分散程度、偏离程度观测值对拟合值的分散程度、偏离程度由于=0所以有:有意思的是:条件:模型必须有截距项2.可决系数该统计量越接近于1,模型的拟合优度越高。问题:在应用过程中发现,如果在模型中增加一个解释变量,R2往往增大(?)这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。但是,现实情况往往是,由增加解

2、释变量个数引起的R2的增大与拟合好坏无关,R2需调整。3.调整的可决系数在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:其中:n-k为残差平方和的自由度,n-1为总体平方和的自由度。一、方程的显著性检验(F检验)方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。1、检验假设即检验模型Y=1+2X2++kXk+中的参数i是否显著不为0。可提出如下原假设与备择假设:H0:2=3=

3、=k=0H1:i不全为03.3统计推断F检验的思想来自于总离差平方和的分解式:TSS=ESS+RSS如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。因此,可通过该比值的大小对总体线性关系进行推断。根据数理统计学中的知识,在原假设H0成立的条件下,统计量服从自由度为(k-1,n-k)的F分布给定显著性水平,可得到临界值F(k-1,n-k),由样本求出统计量F的数值,通过FF(k-1,n-k)或FF(k-1,n-k)来拒绝或不能拒绝原假设H0,以判定原方程总体上的线性关系是

4、否显著成立。2.检验统计量~p值检验法为了方便起见,将F统计量的值记为F0计算p=P{F>F0}称为p值(p-value)如果p>,则p/2>/2,F0落入不能拒绝域,不能拒绝H0,如果p<,落入拒绝域,应拒绝H0。准则:当P值小于显著性水平时,方程在给定显著性水平下是显著的当P值大于显著性水平时,方程在给定显著性水平下是不显著的。F0F不能拒绝域拒绝域3.关于拟合优度检验与方程显著性检验的关系由与可推出或二、变量的显著性检验(t检验)方程的总体线性关系显著每个解释变量对被解释变量的影响都是显著的因此,必须对每个解释变量进行显著

5、性检验,以决定是否作为解释变量被保留在模型中。这一检验是由对变量的t检验完成的。1.检验假设H0:i=0(i=1,2…k)H1:i02.检验统计量(1)t变量其中~(2)t检验统计量给定显著性水平,可得到临界值t/2(n-k),由样本求出统计量t的数值,通过

6、t

7、t/2(n-k)或

8、t

9、t/2(n-k)来拒绝或不能拒绝原假设H0,从而判定对应的解释变量是否应包括在模型中。3.判断**关于P值:以t统计量的观测值作为临界值,并计算该检验的响应显著水平,这就是P值。若H0为真,则~P值检验法(p-valuetest)p值的概

10、念:为了方便,将t统计量的值记为计算p=P{|t|>t0}称为p值(p-value)通常的计量经济学软件都可自动计算出p值如果p<,则p/2</2,t0落入拒绝域,应拒绝H00-t/2t/2/2/2不能拒绝H0拒绝H0拒绝H0t0p/2p/2当P值小于等于给定显著性水平时,所研究的解释变量对被解释变量的影响在该显著性水平下是显著的;当P值大于给定显著性水平时,所研究的解释变量对被解释变量的影响在该显著性水平下是不显著的。4.两类错误H0真H0伪不拒H0对取伪Ⅱ拒H0拒真Ⅰ对Ⅰ:拒真。把不应该引入的变量引入模型,导致多列无关变量

11、,造成虽然参数估计值是无偏,但标准差会大。若不想犯第一类错误,则显著水平需要定得小点。Ⅱ:取伪。把该引入的变量没有引入模型遗漏变量造成参数估计量有偏。三、参数的置信区间问题的提出(1)区间误差注意:不是先有区间,让掉进去,而是先有,再找个区间把它罩住。(2)置信度置信度=把握程度比如,置信度=95%的意思是在100个区间里,有95个区间包括。2.的置信区间对称区间,中心是bk,半径是如何才能缩小置信区间?增大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小;提高模型的

12、拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。提高样本观测值的分散度,一般情况下,样本观测值越分散,的分母的的值越大,致使区间缩小。F值R2P值调整的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。