相关与回归分析

相关与回归分析

ID:27677880

大小:1.54 MB

页数:92页

时间:2018-12-05

相关与回归分析_第1页
相关与回归分析_第2页
相关与回归分析_第3页
相关与回归分析_第4页
相关与回归分析_第5页
资源描述:

《相关与回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十二章相关与回归分析第一节相关关系及种类第二节定类变量的相关分析第三节定序变量的相关分析第四节定距变量的相关分析第五节回归分析7/2/20211社会上,许多现象之间也都有相互联系,例如:身高与体重、教育程度和收入、学业成就和家庭环境、智商与父母智力等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。本书第十章提出了两总体的检验及估计的问题,这意味着我们开始与双变量统计方法打交道了。双变量统计与单变量统计最大的不同之处是,客观事物间的关联性开始披露出来。这一章我们将把相关关系的讨论深入下去,不仅要对相关关系的存在给出判断,更要对相关关系的强度

2、给出测量,同时要披露两变量间的因果联系,其内容分为相关分析和回归分析这两个大的方面。7/2/20212第一节变量之间的相互关系1.相关程度完全相关,指变量之间为函数关系;完全不相关指变量之间不存在任何依存关系,彼此独立。不完全相关介于两者之间。不完全相关是本章讨论的重点。由于数学手段上的局限性,统计学探讨的最多的是定距—定距变量间能近似地表现为一条直线的线性相关。在统计中,对于线性相关,采用相关系数(记作r)这一指标来量度相关关系程度或强度。就线性相关来说,当r=l时,表示为完全相关;当r=0时,表现为无相关或零相关;当0

3、7/2/202132.相关方向:正相关和负相关所谓正相关关系是指一个变量的值增加时,另一变量的值也增加。例如,受教育水平越高找到高薪水工作的机会也越大。而负相关关系是指一个变量的值增加时,另一变量的值却减少。例如,受教育水平越高,理想子女数目越少。要强调的是,只有定序以上测量层次的变量才分析相关方向,因为只有这些变量的值有高低或多少之分。至于定类变量,由于变量的值并无大小、高低之分,故定类变量与其他变量相关时就没有正负方向了。7/2/202143.因果关系与对称关系因果关系中两个变量有自变量(independentVariable)和因变量(depen

4、dentVariable)之分:(1)两个变量有共变关系;(2)因变量的变化是由自变量的变化引起的;(3)两个变量的产生和变化有明确的时间顺序,前者称为自变量,后者称为因变量。表现为对称关系的相关关系,互为根据,不能区分自变量和因变量,或者说自变量和因变量可以根据研究目的任意选定,例如身高和体重之间的关系。7/2/202154.单相关和复相关从变量的多少上看,单相关只涉及两个变量,亦称二元相关;三个或三个以上变量之间的关系称为复相关,亦称多元相关。五、直线相关和曲线相关从变量变化的形式上看,如果关系近似地表现为一条直线,称为直线相关或线性相关;如果关系

5、近似地表现为一条曲线,则称为曲线相关或称为非线性相关。由于数学手段的局限性,我们以学习线性相关为主。在统计学中,通过分段处理线性相关也可以用于处理曲线相关。7/2/20216第二节定类变量的相关分析本节内容:1、列联表2、削减误差比例3、λ系数4、τ系数7/2/202171.列联表列联表,是按品质标志把两个变量的频数分布进行交互分类,由于表内的每一个频数都需同时满足两个变量的要求,所以列联表又称条件频数表。例如,某区调查了357名选民,考察受教育程度与投票行为之间的关系,将所得资料作成下表,便是一种关于频数的列联表。7/2/202182×2频数分布列联

6、表的一般形式习惯上把因变量Y放在表侧,把自变量X放在表头。2×2列联表是最简单的交互分类表。r×c列联表r(row)、c(column)7/2/20219r×c频数分布列联表的一般形式7/2/202110自己志愿知心朋友志愿总数快乐家庭理想工作增广见闻快乐家庭289340理想工作241750增广见闻24410总数3254141007/2/202111两个边际分布:7/2/202112条件频数表中各频数因基数不同不便作直接比较,因此有必要将频数化成相对频数,使基数标准化。这样,我们就从频数分布的列联表得到了相对频数分布的列联表(或称频率分布的列联表)。下

7、表是r×c相对频数分布列联表的一般形式。7/2/202113r×c相对频数分布列联表的一般形式7/2/202114在相对频数分布列联表中,各数据为各分类出现的相对频数(或者频率)。将频数化成相对频数有两种做法:①相对频数联合分布两个边际分布或②相对频数条件分布或7/2/202115r×c相对频数联合分布列联表7/2/202116控制X,Y相对频数条件分布列联表7/2/202117控制Y,X相对频数条件分布列联表7/2/202118[例A1]试把下表所示的频数分布列联表,转化为自变量受到控制的相对频数条件分布列联表,并加以相关分析。投票行为Y受教育程度X

8、大学以上大学以下投票弃权16071296128968合计:1671903577/2/20211

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。