相关与回归分析11

相关与回归分析11

ID:39596989

大小:1.77 MB

页数:53页

时间:2019-07-06

相关与回归分析11_第1页
相关与回归分析11_第2页
相关与回归分析11_第3页
相关与回归分析11_第4页
相关与回归分析11_第5页
资源描述:

《相关与回归分析11》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、统计学原理复习统计学原理第八章相关与回归分析第一节相关分析概述一、函数关系与相关关系正方形面积与边长;脚长与智商;销售收入和消费情况;广告投入与销售收入;GDP与精神病患者;头发长与见识短1.函数关系:变量之间存在严格的数量关系。2.相关关系:变量之间存在不确定的依存关系。3.区别与联系:1.按相关关系涉及的变量多少划分分为单相关、复相关、偏相关。2.按相关形式划分可以分为线性相关和曲线相关。3.按相关的方向划分可分为正相关和负相关。4.按相关关系的程度划分可分为完全相关,不完全相关和不相关。5.按相关性质分为真实相关和虚假相关。二、相关关

2、系的种类(1)确定现象之间有无相关关系,以及相关关系的表现形态(2)确定相关关系的密切程度(3)建立合适的数学模型(4)测定估计值的标准误差三、相关分析的内容定性分析依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。第二节、相关关系的测定相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。二、相关系数(一)相关系数的定义1、相关系数

3、:在线性条件下说明两个变量之间相关关系密切程度的统计分析指标。2、相关系数r的取值范围:-1≤r≤10<

4、r

5、<1表示存在不同程度线性相关:

6、r

7、<0.3为微弱相关;0.3≤

8、r

9、<0.5为低度线性相关;0.5≤

10、r

11、<0.8为显著性线性相关。0.8≤

12、r

13、为高度相关r>0为正相关,r<0为负相关;

14、r

15、=0表示不存在线性关系;

16、r

17、=1表示完全线性相关;例:下表是有关15个地区某种食物需求量和地区人口增加量的资料。(1)相关关系不等于因果关系;(2)相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系;(3)极端值可能影响

18、相关系数。(4)警惕虚假相关3、使用相关系数时应注意的问题回归:regression1889年弗朗西斯•高尔顿爵士遗传学研究回归线平均身高回归分析法产生的历史160165170175180185140150160170180190200YX儿子们身高向着平均身高“回归”,以保持种族的稳定第三节一元线性回归分析回归分析通过一个变量x或一些变量(x1,x2,x3…)的变化解释另一变量y的变化。即根据相关关系的数量表达式(回归方程式)与给定的自变量x,揭示因变量y在数量上的平均变化和求得因变量的预测值的统计分析方法回归方程回归模型反映自变量和因变

19、量之间数学联系的表达式。某一类回归方程的总称。1、根据理论和对问题的分析判断,区分自变量和因变量;2、设法找出适合的数学方程式(即回归模型)描述变量间的关系3、对回归模型进行统计检验;4、统计检验通过后,利用回归模型,根据解释变量去估计,预测因变量。一、回归分析的内容一个自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归二、一元线性回归方程样本一元线性回归方程:以样本统计量估计总体参数斜率(回归系数)截距截距a表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b表明自变量x每变动一个单

20、位,因变量y平均变动b个单位。(估计的回归方程)随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响X对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。三、直线回归方程的求解原理——最小二乘法使因变量的观察值与估计值之间的离差平方和达到最小来求得a和b的方法。即用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。3.回归系数的估计的最小二乘法公式设将Q对求偏导数,并令其等于零,可得:加以整理后有:例:配合回归直线?估计方程的求法(Excel的输出结果)四、一元线性回归方程的检验(一)回归模型

21、检验的种类回归模型的检验包括理论意义检验、回归方程的检验和回归系数的检验。(二)拟合程度的评价1、拟合程度,是指样本观测值聚集在样本回归线周围的紧密程度。2、判断回归模型拟合程度优劣最常用的数量尺度是决定系数。它是建立在对总离差平方和进行分解的基础之上的。3、离差平方和的分解因变量y的取值是不同的,y取值的这种波动称为变差。变差来源于两个方面:由于自变量x的取值不同造成的;除x以外的其他因素(如x对y的非线性影响、测量误差等)的影响。xyy{}}离差分解图3、离差平方和的分解(三个平方和的关系)2)两端平方后求和有1)从图上看有SST=S

22、SR+SSE总离差平方和(SST){回归平方和(SSR){残差平方和(SSE){4、决定系数(r2)1)回归平方和占总离差平方和的比例2)反映回归直线的拟合程度3)取值范围在[0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。