欢迎来到天天文库
浏览记录
ID:36869524
大小:344.60 KB
页数:72页
时间:2019-05-10
《《回归分析部分》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、多元统计课程设计之回归分析长春工业大学线性回归模型一元线性回归模型多元线性回归模型p=1时,先做散点图;p=2时,回归平面;p=3时,回归超平面,几何图形无法表示回归模型的基本假设1.解释变量y为随机变量,而解释变量为非随机变量,观测值是常数。2.Gauss-Markov条件(等方差及不相关假定条件)回归模型的基本假设3.正态分布假设即4.通常为了便于数学上的处理,还要求n>p,即样本容量的个数要多于解释变量的个数。对线性回归模型通常要研究的问题1.如何根据样本求出参数及方差估计;2.对回归方程及回归
2、系数的种种假设进行检验;3.如何根据回归方程进行预测和控制,以及如何进行实际问题的结构分析。正态假设下,参数的最小二乘估计(OSLE)与极大似然估计(MLE)一致,即若线性回归模型为,其中则有,可得若称为的残差。则误差项方差的无偏估计为回归分析步骤step1:确定模型变量;step2:收集、整理统计数据;step3:确定理论回归模型的数学形式;step4:模型参数估计;step5:模型检验;step6:模型改进;step7:回归模型的运用。确定模型变量首先要根据所研究问题的目的设置因变量y,然后再选取
3、与y有统计关系的一些变量作为自变量。对一个具体的经济问题,当研究目的确定之后,被解释变量容易确定,被解释变量一般直接表达、刻画研究的目的。而对被解释变量有影响的解释变量往往不容易被确定。一是由于认识有局限性,我们不可能完全了解对被解释变量有重要影响的全部因素。二是为了模型参数估计的有效性,设置的解释变量之间应该是不相关的。三是我们从经济关系角度考虑非常重要的变量应该引进,但在实际中并没有这样的统计数据。这一点在我国建立经济模型时经常会遇到。这时可以考虑用相近的变量代替,或者由其他几个指标复合成一个新的
4、指标。注:1.不要认为一个回归模型中解释变量越多越好。可能选取与问题无关的变量,也可能由于一些变量具有较强相关性,他们所反映的信息有较严重的重叠,即出现共线性问题。另当变量太多,计算工作量太大,计算误差积累也大,估计出的模型参数精度自然不高。2.回归变量一般一次并不能完全确定,通常要经过反复试算,最终找出最合适的一些变量。收集、整理统计数据确定好回归模型的变量之后,就要对这些变量收集、整理统计数据。数据的收集是建立回归模型的重要一环,是一项基础性工作,样本数据的质量如何,对回归模型的水平有至关重要的影
5、响。常用的样本数据分为时间序列数据和横截面数据时间序列数据——按时间顺序排列的统计数据。对于时间序列数据要注意数据的可比性和数据的统计口径问题。时间序列数据容易产生模型中随机误差项的序列相关,这是因为许多经济变量的前后期之间总是有关联的。对于具有随机误差项序列相关的情况,要通过对数据的某种计算整理来消除序列相关性,最常用的处理方法是差分法。横截面数据——在同一时间截面上的统计数据。用横截面数据作为样本时,容易产生异方差性。对于具有异方差性的建模问题,数据整理就要注意消除异方差性,这常与模型参数估计方法
6、结合起来考虑。时间序列结合横截面数据形成面板数据,由协整分析专门处理样本容量的选择无论是时间序列数据还是横截面数据,样本容量的多少一般要与设置的解释变量数目相配套。通常为了使模型的参数估计更有效,要求样本容量n大于解释变量的个数p。当n
7、特别大或特别小的“野值”。在统计数据质量不高时,经常会遇到这种情况。当然,有时还须利用插值的方法把空缺的数据补齐。确定回归模型的数学形式一元回归模型绘制变量y与x的样本散点图,若n个样本点大致分布在一条直线周围,可考虑采用线性回归模型。多元回归模型关于所有变量求相关阵,观察y与各自变量的相关系数,若与某些自变量相关系数较高,则说明y与这些自变量高度线性相关,故可考虑建立y与这些自变量的线性回归模型。但仅凭相关系数不能确定自变量的取舍。有时可做y与某变量的散点图,来大致确定模型的数学形式。经济回归模型的
8、建立,通常要依据经济理论和一些数理经济学结果。有时,我们无法根据现有资料确定模型的形式,这时可以采用不同的形式进行计算机模拟,对于不同的模拟结果,选择较好的一个做为理论模型。尽管模型中待估的未知参数要等到参数估计、检验之后才能确定,但在很多情况下,可根据实际问题对未知参数的正负及大小范围事先给予确定。模型的参数估计线性回归模型未知参数的估计最主要的方法是普通最小二乘估计(OLSE)。运用OLSE估计未知参数时应首先看具体问题的样本数据是否满足模型的基本假
此文档下载收益归作者所有