欢迎来到天天文库
浏览记录
ID:62122829
大小:513.14 KB
页数:36页
时间:2021-04-15
《第10章事物间的因果关系回归分析.pptx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、事物间的因果关系——回归分析第10章内容提要10.1回归分析概述10.2一元线性回归10.3多元线性回归10.4引入虚拟变量进行回归10.1回归分析概述3回归分析概述为确定变量之间的联系,用一些变量的变化说明另一个变量的变化,并进一步对另一个变量的取值进行预测,这就是回归分析。回归分析研究的是变量之间的相互关系,但这种关系不仅是相关关系,而且是因果关系。因此回归分析要明确区分因变量与自变量。如年龄对收入的影响。因变量(dependentvariable):要说明其变化的、对其进行预测的变量。自变量(independentvariable):用以说明或预测因变量的变量回归模型的类型回归模
2、型一元回归非线性线性多元回归非线性线性10.2一元线性回归6(一)一元线性回归的统计原理两个定距变量的回归是用函数y=f(x)来分析的。我们最常用的是一元回归方程y=a+bx。其中x为自变量,y为因变量,a为截距,b为回归系数。(二)一元线性回归涉及概念常量:a为x等于零时,y的平均估计量。回归部分:它刻画因变量y的取值中,由因变量y与自变量x的线性关系所决定的部分,即可以直接由x估计的部分。b为回归系数,也是回归线的斜率。残差:估计值ŷ和每一个实测值之间的差称为残差。残差表示因变量y除了自变量x以外的其他所有未进入模型或未知但可能与y有关的随机和非随机因素共同引起的变异,即不能由x估
3、计的部分。最小二乘原理即残差的平方和最小。(四)一元线性回归分析第一步:考察因变量的正态性。例:根据数据“儿童.sav”,建立回归模型,考察儿童对电视的接触时间与儿童的知识量之间是否有因果关系。(四)一元线性回归分析第二步:考察因变量与自变量的线性关系。添加回归趋势线的方法:双击图形,进入图表编辑窗口下的Elements——FitLineatTotal选中Linear(四)一元线性回归分析第三步:进行回归分析。因变量自变量Pearson相关系数回归方程的确定系数R2:表示自变量能解释因变量变化的46.8%。进入模型的自变量确定系数R2是测定回归直线拟合优度的重要指标。总变差(TSS)是
4、估计时所产生的误差平方和回归变差(RSS)是 和 之间产生的变差平方和。剩余变差是 和 之间产生的变差平方和。TSS=RSS+ESS对回归模型的显著性检验回归平方和RSS残差平方和ESS如果p值小于0.05,说明R2在统计上是显著的,即有足够的把握认为总体的回归斜率不为0。通常只关心回归方程的斜率在统计上是不是显著的,而不关心截距的值以及它的显著性水平。主要因为:斜率b不仅表达了线性关系的方向,也表达了线性关系的强度,这也是对解释因变量最有用的信息。截距a对解释因变量y的变化起不到任何作用。从实际应用的角度来说,截距是在x=0时y的取值,这是一种特殊的情况,一般不加以考虑。截距a只表
5、示直线在坐标平面中的起点,如果把所有回归系数都进行标准化,这时直线是过原点的,即截距为0。所以,通常不关心截距a的值是否显著。即使不显著,也保留在方程中。回归系数如果p值小于0.05,说明该自变量的回归系数在统计上是显著的,即有足够的把握认为b不为0。常数项即a自变量的回归系数即b建立回归方程:y=1.935+0.021x其中y表示儿童的知识量评分x表示儿童接触电视的时间。10.3多元线性回归15多元线性回归将一元线性回归进行推广,引入多个自变量,以利用更多的信息来解释因变量的变化,即可得多元线性回归方程b0,b1,b2,,bk是参数,称为偏回归系数bi表示假定其他变量不变,当xi每
6、变动一个单位时,y的平均平均变动值e是被称为误差项的随机变量,说明了包含在y里面但不能被k个自变量的线性关系所解释的变异性y是x1,,x2,,xk的线性函数加上误差项e例:某面向年轻人制作肖像的公司计划在国内开设几家分店,收集了目前已设分店的销售数据(y,万元)以及分店所在城市的16岁以下人数(X1,万人)、人均可支配收入(X2,万元)数据见“销售收入.sav”,试建立多元线性回归模型。第一步:考察因变量与自变量的线性关系从散点图矩阵可以看出,销售收入与年轻人人数、人均可支配收入呈线性关系。多元线性回归第二步:考察因变量的正态性在因变量的正态性不理想的情况下,回归方程可以体现因变量与
7、自变量的因果关系,不能用于预测因变量。多元线性回归多元线性回归第三步:根据设想建立回归方程:y=b0+b1×·x1+b2×x2进行多元回归,回归——线性选入回归方程中的自变量选入回归方程中的因变量本例采用强制纳入回归模型的方法。多元回归常使用调整的确定系数R2:此时说明x1和x2两个自变量能共同解释90.7%的因变量的变化。对回归模型的显著性检验如果p值小于0.05,说明至少一个自变量的回归系数不为0,所建立的回归模型有统计意义。回归系数如果p
此文档下载收益归作者所有