直线相关与直线回归

直线相关与直线回归

ID:42181278

大小:279.51 KB

页数:25页

时间:2019-09-09

直线相关与直线回归_第1页
直线相关与直线回归_第2页
直线相关与直线回归_第3页
直线相关与直线回归_第4页
直线相关与直线回归_第5页
资源描述:

《直线相关与直线回归》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、双变量的两种选取方法1、一个变量是选定的(可以精确地测量或严格控制),称为选定变量x,另一个变量是随机的(有不可控制的偶然因素影响),称为随机变量y。例如:儿童的年龄是选定变量,身高则是随机变量。选定变量x值处存在着随机变量y值的总体,常常是x值处y服从正态分布;2、x、y都是随机变量,则存在着一个双变量(x、y)总体。如果在任意的x值处y服从正态分布,在任意的y值处x服从正态分布,则x、y称为双变量正态分布。例如:某一个儿童年龄组的身高与体重是双变量正态分布。双变量研究中存在的两种关系1、相互关系(互依关系)两个变量是平等的,可令任一变量为x,另一变量为y,来研究两个变量的彼此关系或彼此

2、影响,可采用直线相关分析。一般来说,直线相关分析只适用于双变量正态分布资料;2、因果关系(依存关系)两个变量是不平等的,一个为自变量x,另一个为因变量y,来研究x对y的作用或y对x的依赖,可采用直线回归分析。一般来说,直线回归分析可适用于上述两种变量的选取。第一节直线相关分析直线相关(linearcorrelation)当一个变量x由小到大变化,另一个变量y亦相应地由小到大或由大到小变化,两个变量的散点图呈直线趋势,那么,两个变量间存在直线关系。这种直线关系,或分析这种直线关系的理论或方法,统称为直线相关。两变量间直线相关的密切程度和方向,用直线相关系数来表示。直线相关分析的步骤1、散点图

3、(相关图):观察各个散点有无直线趋势,若有直线趋势,可进行直线相关分析。2、计算五个基本数字ΣxΣx2ΣyΣy2Σxy3、求相关系数rr=Σ(x-x)(y-y)/√Σ(x-x)2Σ(y-y)24、相关系数r的假设检验⑴查表法⑵t检验t=

4、r-0

5、/SrSr=√(1-r2)/(n-2)5、根据专业知识作出结论。相关系数的计算本例r=0.9395相关系数及其意义(correlationcoefficient)1.定义:相关系数是描述呈双变量正态分布的两个变量直线相关的密切程度和方向的指标。2.符号:样本相关系数用r表示,总体相关系数用ρ表示,没有单位,取值范围从-1到+1。3.意义:在r值有显

6、著性意义的条件下,|r|值愈接近1,两个变量的关系愈密切;|r|值愈接近0,两个变量的关系愈不密切。r>0为正相关(positivecorrelation),表示y随x增加而增加;r<0为负相关(negativecorrelation),表示y随x增加而减少。当n>100时,|r|≥0.7称为高度相关;0.7>|r|≥0.4称为中度相关;|r|<0.4称为低度相关。相关系数的假设检验上例中的相关系数r等于0.9395,似乎说明10只大白鼠进食量(g)和增加体重(g)之间存在相关关系。但是,这10只大白鼠只是总体中的一个样本,由此得到的相关系数会存在抽样误差。因为,总体相关系数()为零时,

7、由于抽样误差,从总体抽出的10只,其r可能不等于零。所以,要判断该样本的r是否有意义,需与总体相关系数=0进行比较,看两者的差别有无统计学意义。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。相关系数r的t检验样本相关系数r≠0的原因:①由于抽样误差引起,总体相关系数ρ=0②存在相关关系,总体相关系数ρ≠0方法:式中Sr为相关系数的标准误本例t=7.7587总体相关系数ρ的可信区间1、相关系数变换为Z值,使之近似呈正态分布2、Z值的标准误SZ3、Z值的可信区间Z值的95%可信区间:Z±1.96SZZ值的99%可信区间:Z±2.58SZ4、Z值的

8、可信区间转换为总体相关系数ρ的可信区间,分别将Z值可信区间的上下限转换为ρ值可信区间的上下限直线相关分析中应注意的问题1、两个变量间毫无实际意义时不要作直线相关分析;2、两个变量间呈线性关系时,要根据专业知识分辨是伴随关系还是因果关系,从而确定作直线相关分析或作直线回归分析;3、相关分析要求资料x、y两变量都是来自正态总体的随机变量,x和y可以互换位置,不分自变量和因变量;4、不要把r的显著性水平误解为相关的密切程度。小样本相关系数r经假设检验只能推断两变量间有无直线相关存在。只有当大样本(n>100)时,

9、r

10、≥0.7称为高度相关;0.7>

11、r

12、≥0.4称为中度相关,

13、r

14、<0.4称为低

15、度相关。第二节直线回归分析直线回归(linearregression)1.定义:直线回归又称简单回归(simpleregression),是用于研究两个连续性变量X和Y之间线性依存变化的数量关系。其中X为自变量(independentvariable),Y为依赖于X的因变量(dependentvariable),也称为反应变量(responsevariable)。两变量之间有数量依存关系,但非一一对应的函数关系。如年龄与

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。