相关分析和回归分析

相关分析和回归分析

ID:18464889

大小:637.50 KB

页数:6页

时间:2018-09-18

上传者:jjuclb
相关分析和回归分析_第1页
相关分析和回归分析_第2页
相关分析和回归分析_第3页
相关分析和回归分析_第4页
相关分析和回归分析_第5页
资源描述:

《相关分析和回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

相关分析和回归分析客观事物之间的关系分为函数关系和统计关系,函数关系也就是我们通常所说的一一对应的关系,而统计关系是指两事物之间的一种非一一对应的关系,即当一个变量x取一定值时,另一变量y无法依确定的函数取唯一确定的值。事物之间的统计关系是普遍存在,且有的关系强,有的关系弱。相关分析和回归分析都是以不同方式测度事物之间统计关系的有效工具。实际应用中。这两种分析方法经常互相结合渗透。一、相关分析相关分析通过图形和数值两种方式,能够有效的揭示事物之间统计关系的强弱程度。1、散点图能直观的显示数据之间的相关关系,可以利用曲线将点散布的主要轮廓描述出来,使数据的主要特征更突出。如下图:研究04年四层金指的报废面积与入仓面积的相关关系上图看出:数据集中分布在直线周围,说明是高度正相关的。 2、相关系数散点图能直观的展现变量之间的统计关系,但并不精确。相关系数以数值的方式精确的反映了两个变量间线形相关的强弱程度。ØR=,其中=,,.Ø相关系数R的取值在-1~+1之间。ØR>0表示两变量之间存在正的线性相关关系;R<0表示两变量之间存在负的线性相关关系。ØR=1表示两变量存在完全正相关;R=-1表示两变量存在完全负相关;R=0表示两变量不存在线性相关关系。Ø|R|>0.8表示两变量之间具有较强的线性关系;|R|<0.3表示两变量之间的线性相关关系较弱。上例中,R=0.974,说明报废面积与入仓面积之间是强正相关的。二、一元线性回归在实际应用中,我们常常需要考虑某一现象与影响它的最主要因素的关系,回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。一元线性回归是最简单的回归模型。1、一元线性回归的数学模型其中,,称为回归系数,+ x表示由于x的变化引起的y的变化;表示其他随机因素的影响,它是一个随机变量,满足期望值为零,方差值为,实际问题研究中,为方便对参数作区间估计和假设检验,假定~,则因变量。同时,建立模型前,要保证采集的n组数据都是独立的。2、参数的估计回归分析的主要任务就是要通过采集的n组样本值(,)i=1,2,…n,对,进行估计,得到一元线形经验回归方程.l采用最小二乘估计的方法进行参数估计。l最小二乘估计的主要思想:考虑因变量与其估计值之间的偏差平方和的最小值,即,Q=min=min用微积分中求极值的原理,得到参数的估计值:对上例的数据进行回归分析,得到回归方程为:y=1.0334+0.0394x3、回归方程的显著性检验当我们得到回归方程以后,还不能马上用它去作分析和预测,还需要运用统计方法对回归方程进行检验,确定得出的回归方程是否真正描述了变量y与x之间的统计规律性。即作是否为零的假设检验。 :=0表明回归方程为一常数,与x无关,即自变量x对因变量y无影响,回归方程不成立;如果原假设不成立,即0,回归方程才有意义。l将y的n个观测值之间的差异,用观测值与其平均值的偏差平方和来表示,称为y的离均差平方和,记为,说明未考虑x与y的回归关系时y的变异。将分解为如下形式:则:=+;称为回归平方和,记为或,反映在y的总变异中由于x与y的直线关系而使y变异减小的部分,也就是在总平方和中可以用x解释的部分。越大,说明回归效果越好。称为残差平方和,记为或,反映了x对y的线性影响之外的一切因素对y的变异的作用,也就是在总平方和中无法用x解释的部分,在散点图中,各实测点离回归直线越近,就越小,说明直线回归的估计误差越小。l上述三个平方和,各有其相应的自由度,且:  =+  =n-1,=1,=n-2,   n为样本个数l采用F检验 构造统计量F==~F(1,n-2)、分别称为回归均方与剩余均方,统计量F服从自由度为、的F分布。对于回归方程的具体检验可放在方差分析表上进行。l求出F值后,在给定的显著性水平下,查F界值表,得到的值。1-表示检验的可靠度。如果F,则称变量x与y没有明显的线性关系,接受,说明回归方程不显著;如果F>,拒绝,说明回归方程显著,x与y有显著的线性关系。上例中,对回归方程进行显著性检验,结果为:方差分析dfSSMSFSignificanceF回归分析192583.8392583.833691.637.1132E-131残差2005015.87825.07939总计20197599.71由上表:F=3691.83>=7.1132E-131,说明x与y之间有着十分显著的线性关系,回归方程高度显著。三、回归方程的预测和应用当建立了回归方程以后,对已知,代入回归方程即可得到,只是一个大概值,意义不大,给出的一个预测值范围比只给出更可信。即,对给定的显著性水平,找到一个区间,使对应于某特定的实际值以1-的概率被区间所包含,即: 当n较大,较小时,可以用近似预测区间。置信水平为0.95与0.99的近似预测区间分别为:与四、应用直线回归应注意的问题1、作回归分析要有实际意义,不能把毫无关联的两种现象勉强作回归分析。2、在进行直线回归分析前,先绘制散点图,当观察点的分布有直线趋势时,才适合作直线回归分析。五、直线回归与相关的区别1、回归要求因变量y服从正态分布,x是可以精确测量和严格控制的变量;相关要求两个变量x,y都服从正态分布。2、说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭