双变量回归与相关

双变量回归与相关

ID:5828754

大小:1.22 MB

页数:124页

时间:2017-12-13

双变量回归与相关_第1页
双变量回归与相关_第2页
双变量回归与相关_第3页
双变量回归与相关_第4页
双变量回归与相关_第5页
资源描述:

《双变量回归与相关》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、双变量回归与相关之前的章节着重于描述某一(单)变量的统计特征或者比较该变量的组间差别。但在医学中常会遇到研究两个变量之间关系的问题,中学学的两个变量之间的关系是一种确定性的关系,而在医学研究中研究的两个变量之间的关系是一种非确定的关系。虽然是非确定性的关系,但两个变量之间也有关,其关系可以通过两个变量回归与相关分析的方法找到规律。第一节直线回归一、直线回归的概念直线回归是一种研究两个变量的线性依存关系统计分析方法。两个变量之间的关系:依存关系相关关系例9-1某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表9-1

2、。估计尿肌酐含量(Y)对其年龄(X)的回归方程。表9-18名正常儿童的年龄(岁)与尿肌酐含量(mmol/24h)编号12345678年龄X131196810127尿肌酐含量Y3.543.013.092.482.563.363.182.65题中年龄是自变量(X),尿肌酐含量为应变量(Y)。儿童的尿肌酐含量随着其年龄的变化而变化,所以两个变量之间存在依存关系。对资料中的8对数据作散点图,绘出的点在一条直线附近,表示这两个指标之间存在着线性依从关系。图9-18名儿童的年龄与其尿肌酐含量散点图研究的两个指标之间存在依存关系,对指标进行观测

3、,观测结果作散点图,若绘出的点在一条直线附近,则表示这两个指标之间可能存在着线性依从关系。两个指标之间的线性依从关系可以通过直线回归方程来表示。经验回归方程或样本回归方程总体回归方程总体回归方程中:μY│X为对于X各个取值相应的Y的总体均数α为常数项,即回归直线在Y轴上的截距,回归直线与Y轴的交点到原点的距离β为回归系数,即回归直线的斜率样本回归方程中:为X所对应的Y的总体均数μY│X的一个样本估计值,称为回归方程的预测值或Y的估计值a为常数项或截距,是α的样本估计值b为回归系数,是β的样本估计值常数项a的取值有3种情况:a>0回

4、归直线与Y轴的交点在原点上方a=0回归直线过原点a<0回归直线与Y轴的交点在原点下方a0Yxa>0a=0a<0回归系数b的取值有3种情况:b>0回归直线从左下方指向右上方,X、Y同向变化b=0回归直线与X轴平行,X、Y之间不存在线性依存关系b<0回归直线从左上方指向右下方,X、Y反向变化0YXb>0b=0b<0自变量X每改变一个单位,应变量Y一定改变b个单位X=0Y=1X=1Y=3X=2Y=5一般直线方程:直线回归方程:X=0=1X=1=3X=2=5回归系数b的统计学意义:自变量X每改变一个单位,应变量Y平均改变的单位数。直线回归

5、分析的除要求两变量之间呈直线依从关系外,一般还要求每个X对应Y的总体为正态分布,各个正态分布的总体方差相等且各次观测相互独立。——LINEL(linear)线性I(independent)独立N(normaldistribution)正态E(equalvariance)等方差X3μY

6、X3μY

7、X2X2X1μY

8、X1二、直线回归方程的求法当a、b确定时,回归方程就可以唯一确定,所以求方程实际上就是指求解a、b,要求根据求解的a、b画出的直线能最好的代表数据点分布趋势。“最小二乘”原则:各点的残差平方和最小残差:实测值Y与回归直线上

9、的Y的估计值的纵向距离Y-根据“最小二乘”原则,a、b的计算公式:式中:lXY为X、Y的离均差积和;lXX为X的离均差平方和1。画散点图作用:①观察两指标之间是否有线性关系②便于发现可疑点(异常点),当其他点均在一起,有一个点与直线相差很远,经核对确认是过失误差或者是重复测定后认定是随机因素造成的偶然结果,剔除后再进行分析。2。准备计算①输入数据,计算以下数据:②计算lXX、lYY、lXY:3。计算a和b4。写出方程,画出回归直线在散点图上绘制出回归直线,此直线必然过点()且与Y轴相交于截距a。如果散点图没有从坐标系原点开始,可在

10、自变量的实测范围内远端取易于读数的X值代入回归方程的到另一个点的坐标,连接两点绘出回归直线。三、直线回归中的统计推断(一)回归方程的假设检验由资料求出样本回归方程,只是完成了统计分析中两变量关系的统计描述,但由于进行抽样研究中避免不了抽样误差,所以需要对样本所来自的总体是否存在直线回归关系进行检验,即:推断总体回归系数β是否为0。β=0b≠0(μY

11、X=3)1。方差分析P(X,Y)任意一点P的纵坐标被回归直线与均数截成三段,分别是:其中:①为总离均差平方和,用SS总表示,它是未考虑X与Y的回归关系时Y的总变异。ν总=n-1②为回归

12、平方和,用SS回归表示,由于对于一个固定的样本其样本均数是固定的,所以这部分变异是由于引起的。当X被引入回归方程后,正是由于X的不同导致了的不同,因此SS回归反映了在Y的变异中可以用X与Y的直线关系解释的部分变异。b离0越远,X对Y的影响越大,SS

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。