欢迎来到天天文库
浏览记录
ID:29658452
大小:321.50 KB
页数:14页
时间:2018-12-21
《《相关与回归》word版》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第九章相关与回归2相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。本章介绍相关和回归分析的基本原理和系统分析的方法。第一节相关的概念和二元概率分布1.什么是相关关系?变量之间关系函数关系相关关系共变关系互为因果关系因果关系确定性依存关系不确定(随机性)依存关系2.相关关系种类正相关一元相关线性相关负相关多元相关曲线相关yxxyxxyxxyxxxxxxxxxxxxxx正相关负相关曲线相关不相
2、关143.二元概率分布例:某企业200名职工的企业工龄和时工资的分布企业工龄(年)x时工资级别(元)y总计123120(0.10)0(0)0(0)20(0.10)240(0.20)10(0.05)0(0)50(0.25)324(0.12)24(0.12)12(0.06)60(0.30)416(0.08)26(0.13)8(0.04)50(0.25)50(0)0(0)20(0.10)20(0.10)总计100(0.50)60(0.30)40(0.20)200(1)联合频数联合概率边缘频数边缘概率二元概率分布的
3、5个特征值:(1)x的数学期望:(2)y的数学期望:(3)x的方差:(4)y的方差:(5)x与y的协方差:可度量x与y之间的线性相关关系第二节简单线性相关从散点图看协方差的作用一、相关系数yIIIIVIII0x14协方差σxy可表明x、y的“共变性”和线性相关的方向。但不是一个适用于比较的相关关系的量度。积矩相关系数是对它的改进。未分组资料:分组资料:二、相关系数的检验(t检验)H0:p=0,H1:p≠0检验统计量第三节一元线性回归模型一、回归的概念和回归分析的特点回归分析和相关分析的联系和区别联系区别①理
4、论和方法具有一致性;②无相关就无回归,相关程度越高,回归越好;③相关系数和回归系数方向一致,可以互相推算。①相关分析中,x与y对等,回归分析中,x与y要确定自变量和因变量;②相关分析中x,y均为随机变量,回归分析中,只有y为随机变量;③相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。二、一元线性回归模型14(一)一元线性回归模型的性质斜率(回归系数)截距回归系数b表明自变量x每变化一个单位因变量y的增(减)量。1.b与r的关系:r>0b>0r<0b<0r=0b=0aaa000xyyyb-bxx
5、2.是理论模型,表明x与y两变量之间的平均变动关系。(实际值):随机干扰:各种偶然因素,观察误差和其他被忽视因素的影响。X对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。yx0(二)一元线性回归模型的确定根据实际数据,用最小平方法,即使14,分别对a、b求编导并令其为零,求得两个标准方程:解联立方程,得到三、判定系数(r2)和估计标准误(Sxy)(一)判定系数(r2)判定系数是对回归模型拟合优度的评价。Y0yx0总偏差=回归偏差+剩余偏差r2表示全部偏差中有百分之几的偏差可由x与y的回
6、归关系来解释。(相关系数)14(二)估计标准误(Sxy)Sxy是二元正态分布中因变量实际值(yj)对估计值()离散程度的量度。xy99.73%94.45%68.27%Sxy越小,拟合越好;Sxy越大,拟合越差。Sxy也是用自变量对因变量进行区间估计的抽样误差。四、一元线性回归模型的显著性检验(一)回归系数b的检验设总体回归系数为β0H0:β=0;H1:β≠01.n≥30时检验统计量(β=0)σb是样本回归系数抽样分布的标准差。通常是未知的,用其估计量代替。14给定显著性水平α,查Z表可知其临界值。2.n<3
7、0时检验统计量(β=0)给定显著性水平α,查t表可知其临界值。(二)回归模型整体的F检验检验统计量或(可见,F检验实质上是对总体回归模型H0:R2=0的检验。)14五、应用一元回归模型进行区间估计1.n≥30时+3Sxyy给定x0,y0的置信度(1-α)+2Sxy的置信区间为:+1Sxy-1Sxy-2Sxy-3Sxyx00x2.n<30时给定x0,y0的置信度(1-α)的置信区间为:y0x0x给定的x0越接近,y值估计的精确度越高。第四节多元线性回归模型一、多元线性回归模型的性质与模型的确定1.模型性质14
8、模型的一般形式:二元线性回归模型:截距偏回归系数△b1:假定x2固定时x1每变动1个单位引起的y的增量。△b2:假定x1固定时x2每变动1个单位引起的y的增量。△,是x1和x2共同变动引起的y的平均变动,反映一组自变量与因变量的平均变动关系。△是给定x1、x2计算得到的估计值,是y的实际值的数学期望。(实际值)随机干扰:各种偶然因素观察误差和其他被忽视因素的影响。一组自变量对y的线性影响而形成的系统部分,反映x与
此文档下载收益归作者所有