第十二章相关与回归分析

第十二章相关与回归分析

ID:15274290

大小:247.50 KB

页数:7页

时间:2018-08-02

第十二章相关与回归分析_第1页
第十二章相关与回归分析_第2页
第十二章相关与回归分析_第3页
第十二章相关与回归分析_第4页
第十二章相关与回归分析_第5页
资源描述:

《第十二章相关与回归分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第十二章相关与回归分析社会学研究不满足于对单变量的分析,往往要求进一步分析双变量之间的关系,然后再拓展到分析多变量之间的关系。第十章提出了两总体的检验及估计的问题,这意味着我们开始与双变量统计方法打交道了。双变量统计与单变量统计最大的不同之处是,客观事物间的关联性开始披露出来。第一节变量之间的相互关系1.相关程度与方向从一定意义上讲,函数关系是相关关系的一个特例,即变量间严格一一对应,这是相关程度最强的一种相关关系,称为完全相关(perfectassociation)。而变量相关程度的另一个极端值是

2、无相关(noassociation)或零相关(zeroassociation),即变量之间不存在任何数量上的依存关系。相关程度介于两个极端值之间的则是不完全相关,相关关系大多指的是这种情况,这时变量间在数量关系上有着不很严格的相互依存关系。在统计中,对于线性相关,采用相关系数(记作r)这一指标来量度相关关系程度或强度。就线性相关来说,当=l时,表示为完全相关;当r=0时,表现为无相关或零相关;当0<<1时,表现为不完全相关。但在采用相关系数r这一指标时必须注意到,存在着完善曲线而r=0的情况。当然,

3、变量在其他测量层次的关系强度,也可以用同样的思路加以考虑。当变量间相关时,还可以探讨其相关方向,可以分正和负两个方向。所谓正相关关系是指一个变量的值增加时,另一变量的值也增加。而负相关关系是指一个变量的值增加时,另一变量的值却减少要强调的是,只有定序以上测量层次的变量才能分析相关方向,因为只有这些变量的值有高低或多少之分。至于定类变量,由于变量的值并无大小、高低之分,故定类变量与其他变量相关时就没有正负方向了。2.因果关系除了相关程度与方向这两种性质外,还应注意两个变量的相关关系是否具有因果性。只有

4、当两个变量之间的关系同时满足以下三个条件时,才能断定这种关系是因果关系:(1)两个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化。(2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的。(3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。因果关系是一种非对称关系(asymmetricalrelationship),这时只是自变量影响因变量,因变量不会反过来影响自变量。如果不能确定或无法区分变量的作用方向,这种情况就

5、称为对称关系(symmetricalrelationship)。第二节定类变量的相关分析1.列联表-7-列联表,是按品质标志把两个变量的频数分布进行交互分类,由于表内的每一个频数都需同时满足两个变量的要求,所以列联表又称条件频数表。2×2列联表,是最简单的交互分类表,r×c频数分布列联表则是一般形式。条件频数表中各频数因基数不同不便作直接比较,因此有必要将频数化成相对频数,使基数标准化。这样,我们就从频数分布的列联表得到了相对频数分布的列联表(或称频率分布的列联表)。在相对频数分布列联表中,各数据为

6、各分类出现的相对频数(或者频率)。将频数化成相对频数有两种做法:①如果=,我们得到的是联合分布的列联表,此时也可以称为联合频率;②如果=或者=,我们得到的是关于X或者关于Y的相对频数的条件分布,此时也可以称为条件频率通过列联表研究定类变量之间的关联性,实际上是通过相对频数条件分布的比较进行的。如果不同的X,Y的相对频数条件分布不同,且和Y的相对频数边际分布不同,则两变量之间是相关的。而如果变量间是相互独立的话,必然存在着Y的相对频数条件分布相同,且和它的相对频数边际分布相同。2.削减误差比例在社会统

7、计中,表达相关关系的强弱,削减误差比例PRE(ProportionateReductioninError)的概念是非常有价值的。削减误差比例的原理是,如果两变量间存在着一定的关联性,那么知道这种关联性,必然有助于我们通过一个变量去预测另一变量。其中关系密切者,在由一变量预测另一变量时.其盲目性必然较关系不密切者为小。因此,变量间的相关程度,可以用不知Y与X有关系时预测Y的误差E0,减去知道Y与X有关系时预测Y的误差E1,再将其化为比例来度量。将削减误差比例记为PRE,得PRE=削减误差比例PRE适用

8、于各测量层次的变量,但公式中E1、E2的具体定义,不仅对不同测量层次的变量有所不同,而且对同一测量层次的变量也有所不同。系数和τ系数便是在定类测量的层次上以削减误差比例PRE为基础所设计的两种相关系数。3.系数(1)对称的系数(假设X是自变量,Y是因变量)(2)不对称的系数(假设X是自变量,Y是因变量)系数有PRE意义,其统计值域是[0,1]。系数的缺点是比较粗略,不够灵敏,因为它以众数作为预测的准则,对条件频数分布列联表中众数频数以外的条件频数不予理会-7-。另外,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。