欢迎来到天天文库
浏览记录
ID:50113569
大小:420.50 KB
页数:15页
时间:2020-03-05
《一元线性回归分析应用:预测问题.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、§2.4一元线性回归分析的应用:预测问题一、Ŷ0是条件均值E(Y
2、X=X0)或个别值Y0的一个无偏估计二、总体条件均值与个别值的置信区间对于一元线性回归模型给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值Ŷ0,可以以此作为其条件均值E(Y
3、X=X0)或个别值Y0的一个近似估计。但是严格地说,这只是被解释变量预测期实际值的一个估计值,而不是预测期的实际值。原因:(1)参数估计量是不确定的,随样本而变;(2)预测期随机干扰项0的影响。说明(注意教材p46的某些表述不准确)所以,给定样本以外的解释变量的值X0,依据样本回归方
4、程得到的Ŷ0仅仅是预测期条件均值E(Y0)[注:简写符号,见教材P49]或个别值Y0的实际值的一个点估计值,预测期E(Y0)或Y0的实际值仅以某一个置信水平被以该估计值为中心的一个区间所包含。换句话说,对样本以外的被解释变量进行预测,是一个区间估计问题。一、Ŷ0是条件均值E(Y
5、X=X0)或个别值Y0的一个无偏估计(见教材p46-47)(1)对于总体回归函数E(Y
6、X=X)=0+1X,当X=X0时E(Y
7、X=X0)=0+1X0于是可见,Ŷ0是条件均值E(Y
8、X=X0)的无偏估计。或者说,Ŷ0是条件均值E(Y0)的无偏估计。(2
9、)对于总体回归模型Y=0+1X+,当X=X0时于是于是可见,Ŷ0也是个别值Y0的无偏估计。二、总体条件均值与个别值的置信区间1、总体条件均值E(Y0)的置信区间(教材p47)由于并且因此故可以证明(参见潘文卿、李子奈、高吉丽:《计量经济学习题集》P12例9)所以又因所以,可以构造如下的t统计量:(有补充)(参见周纪芗《回归分析》P14)于是,在1-的置信度下,总体均值E(Y
10、X0)的置信区间为记则上述t统计量可以写为这就是教材P48所讲的:2、总体个别值Y0的预测区间(教材p48,有补充)由Y0=0+1X0+知:于是而Ŷ
11、0与Y0是独立的,且又因所以,可以构造如下的t统计量:记从而在1-的置信度下,Y0的置信区间为则在P34例2.2.1的可支配收入-消费支出例子中,得到的样本回归函数为:(见教材P48-49)则当X0=1000时,Ŷ0=–103.172+0.777×1000=673.84而因此,总体均值E(Y0)的95%的置信区间为:同样地,由于(补充)673.84-2.30661.0512、.88或(372.03元,975.65元)所以,当X=1000时,总体单值Y0的95%的置信区间为:对每个X值,求总体均值E(Y)的(1-)置信区间,然后将这些区间的端点(置信限)分别连接起来,可以得到总体回归函数的置信带(域)(confidenceband)。对每个X值,求总体单值Y的(1-)置信区间,然后将这些区间的端点分别连接起来,可以得到总体单值的置信带(域)。图2.4.1Y均值与个别值的置信区间对于Y的总体均值E(Y0)与个体值Y0的预测区间(置信区间),有以下结论:(1)样本容量n越大,预测精度越高;反之,预测精度越低13、。(2)样本容量n一定时,置信带的宽度在X均值处最小,在其附近进行预测(插值预测)精度高;X越远离其均值,置信带越宽,预测精度将下降。
12、.88或(372.03元,975.65元)所以,当X=1000时,总体单值Y0的95%的置信区间为:对每个X值,求总体均值E(Y)的(1-)置信区间,然后将这些区间的端点(置信限)分别连接起来,可以得到总体回归函数的置信带(域)(confidenceband)。对每个X值,求总体单值Y的(1-)置信区间,然后将这些区间的端点分别连接起来,可以得到总体单值的置信带(域)。图2.4.1Y均值与个别值的置信区间对于Y的总体均值E(Y0)与个体值Y0的预测区间(置信区间),有以下结论:(1)样本容量n越大,预测精度越高;反之,预测精度越低
13、。(2)样本容量n一定时,置信带的宽度在X均值处最小,在其附近进行预测(插值预测)精度高;X越远离其均值,置信带越宽,预测精度将下降。
此文档下载收益归作者所有