欢迎来到天天文库
浏览记录
ID:37480796
大小:1.32 MB
页数:30页
时间:2019-05-12
《简单回归的统计检验》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、简单回顾:简单线性回归的基本假定对模型和变量的假定①模型设定是正确;②解释变量X在重复抽样中取固定值;若X是随机的,则与扰动项u不相关;对随机扰动项的假定①零均值②同方差③不序列相关④服从正态分布简单回顾:普通最小二乘估计量(ordinaryleastSquaresEstimators)称为最佳线性无偏估计量(bestlinearunbiasedestimator,BLUE)线性性无偏性最小方差性3第四讲回归的统计检验拟合优度检验变量的显著性检验参数的置信区间估计概念:样本回归线是对样本数据的一种拟合。●不同
2、的模型(不同函数形式)可拟合出不同的样本回归线●相同的模型用不同方法去估计参数,也可以拟合出不同的回归线拟合的回归线与样本观测值总是有偏离。样本回归线对样本观测数据拟合的优劣程度,可称为拟合优度。如何度量拟合优度呢?拟合优度的度量建立在对Y的总变差分解的基础上4拟合优度的度量YX5离差分解的图示(以某一个观测值为例)离差平方和的分解因变量Y的取值是不同的,Y取值的这种波动称为变差。变差来源于两个方面由于自变量x的取值不同造成的除x以外的其他因素(如x对y的非线性影响、测量误差等)的影响对一个具体的观测值来说,
3、变差的大小可以通过该实际观测值与其均值之差来表示。将上式两边平方加总,可证得(提示:交叉项)(TSS)(ESS)(RSS)或者表示为总变差(TSS):被解释变量Y的观测值与其平均值的离差平totalsumofsquares方和(总平方和)(说明Y的总变动程度)解释了的变差(ESS):被解释变量Y的估计值与其平均值的explainedsumofsquares离差平方和(回归平方和)剩余平方和(RSS):被解释变量观测值与估计值之差的平方residualsumofsquares和(未解释的平方和)7一、总变差的分
4、解以TSS同除总变差等式两边:或定义:回归平方和(解释了的变差ESS)在总变差(TSS)中所占的比重称为可决系数,用或表示:8或可决系数可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。反之可决系数越小,说明模型对样本观测值的拟合程度越差。可决系数的特点:●可决系数取值范围:●随抽样波动,样本可决系数是随抽样而变动的随机变量●可决系数是非负的统计量9可决系数的作用联系:数值上可决系数是相关系数的平方10可决系数与相关系数的关系区别:可决系数相关系数是就模型而言是就两个变量而言说
5、明解释变量对被解释说明两变量线性依存程度变量的解释程度度量不对称的因果关系度量对称的相关关系取值0≦≦1取值-1≦r≦1有非负性可正可负11练习一:某一元回归模型中,由27个样本数据求得解释变量和被解释变量的相关系数为0.8,回归平方和(ESS)为36。求:①可决系数是多少(R2)?②残差平方和(RSS)?③μ的总体方差()无偏估计值()?13回归系数的区间估计和假设检验为什么要作区间估计?运用OLS法可以估计出参数的一个估计值,但OLS估计只是通过样本得到的点估计,它不一定等于真实参数,还需要寻求真实参数的
6、可能范围,并说明其可靠性。为什么要作假设检验?OLS估计只是用样本估计的结果,是否可靠?是否抽样的偶然结果呢?还有待统计检验。区间估计和假设检验都是建立在确定参数估计值概率分布性质的基础上。14OLS估计的分布性质基本思想是随机变量,必须确定其分布性质才可能进行区间估计和假设检验怎样确定的分布性质呢?是服从正态分布的随机变量,决定了也是服从正态分布的随机变量;是的线性函数,决定了也服从正态分布正态正态正态只要确定的期望和方差,即可确定的分布性质线性特征(线性估计的重要性)15●的期望:(已证明是无偏估计)●的
7、方差和标准误差(标准误差是方差的平方根)注意:以上各式中均未知,但是个常数。的期望和方差16基本思想:是的方差,而不能直接观测,只能从由样本得到的去获得有关的某些信息,去对作出估计。可以证明其无偏估计为(这里的n-2为自由度,即可自由变化的样本观测值个数)注意区别:是未知的确定的常数;是由样本信息估计的,是个随机变量对随机扰动项方差的估计17对作标准化变换为什么要对作标准化变换?在正态性假定下,由前面的分析已知但在对一般正态变量作实际分析时,要具体确定的取值及对应的概率,要通过正态分布密度函数或分布函数去计算
8、是很麻烦的,为了便于直接利用“标准化正态分布的临界值”,需要对作标准化变换。标准化的方式:标准正态分布函数18●在已知时对作标准化变换,所得Z统计量为标准正态变量。已知时,对作标准化变换注意:这时和都不是随机变量(X、、都是非随机的)19条件:当未知时,可用(随机变量)代替去估计参数的标准误差。这时参数估计的标准误差是个随机变量。●样本为大样本时,作标准化变换所得的统计量Zk,也可以视为标准正态
此文档下载收益归作者所有