欢迎来到天天文库
浏览记录
ID:41866207
大小:376.51 KB
页数:20页
时间:2019-09-03
《双变量相关与回归》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第九章双变量相关与回归BivariateCorrelationandRegression医学统计学萨建DepartmentofHealthStatistics,PublicHealthSchool,ShanXiMedicalUniversityOffice:0351-4135049Email:sajian6067609@163.com2021/8/231医学统计学医学上,许多现象之间也都有相互联系,例如:身高与体重、体温与脉搏、产前检查与婴儿体重、乙肝病毒与乙肝等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。这里,体温和脉搏的关系就比产前检查与婴儿体重之间的关系密切
2、得多,而体重和身高的关系则介与二者之间。另外,可以说乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之间是因果关系;但是,有的现象之间因果不清,只是伴随关系,例如丈夫的身高和妻子的身高之间,就不能说有因果关系。相关与回归就是用于研究和解释两个变量之间相互关系的。2021/8/232一、简单线性回归回归分析是研究一个变量(Y)和另外一个或一些变量(X)间线性依存关系的统计分析方法。如在青少年生长发育研究中体重随着身高的增长而增长,按专业知识,描述两个变量的数量变化关系,宜将体重作为应变量(dependentvariable),身高作为自变量(independentvariable
3、)。依存关系简单线性回归(simplelinearregression)一个X多重线性回归(multiplelinearregression)多个X医学统计学2021/8/233采用线性回归分析可以解决以下几方面的问题:1、探讨体重是否随身高的增长而增加?2、体重与身高的关系呈直线还是曲线关系?3、如何采用回归方程定量地描述两者间的关系?4、该地15岁男童身高每增加1厘米,体重平均增加多少公斤?5、所建回归方程是否成立?即两变量间线性依存关系是否存在?6、如何由身高预测该地15岁男童的体重?医学统计学一、简单线性回归2021/8/234散点图在做回归或者相关分析以前,对数据必须要
4、做散点图!为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的。例如,每人的身高和体重。然后在直角坐标系上描述这些点,这一组点集称为散点图。医学统计学一、简单线性回归2021/8/235医学统计学一、简单线性回归由图9-1可见,体重随身高的增加而递增,并呈直线增长趋势。但身高相同者未必有相同的体重,说明体重除了受身高的影响之外,还可能受到一些未知的,诸如营养、生活方式、遗传等因素的影响。因此,回归分析所描述的两个变量间的关系,不全是一一对应的函数关系(确定性关系),而是一种非确定性关系。2021/8/236实际应用中采用简单线性回归模型来定量描述应变量与自变量之
5、间的数量关系。总体线性回归方程记作β为总体回归系数(regressioncoefficient),即直线的斜率,其统计学意义是X每增加(或减少)一个单位,Y平均改变β个单位(即Y的均数改变β个单位)。表示Y随X改变的平均变化量,β>0,表明Y随X的增加而增加;β<0,表明Y随X的增加而减少;β=0,表明Y与X无线性回归关系。α为回归直线在轴上的截距(intercept),其统计学意义为X取值为0时,方程所估计值Y的平均水平。截距的解释一定要符合专业实际。医学统计学一、简单线性回归2021/8/237设a和b是α和β的估计值,则可拟合得到样本线性回归方程表示x取某定值时相应总体均数
6、Y的点估计值,b称为样本回归系数,也是有单位,有符号的。其回归方程满足三个基本性质:①为最小;②;③回归直线必然通过中心点。其中()称为残差(residual)。医学统计学一、简单线性回归2021/8/238回归方程的估计:最小二乘法(保证回归方程满足三个基本性质)保证各实测点至直线的纵向距离()的平方和,即残差平方和最小。考查回归直线是否正确的方法:1、回归直线必然通过中心点2,将回归直线左端延长与Y轴相交,交点纵坐标为截距3,要注意,直线只能在实测范围内应用,不能随意延长!医学统计学一、简单线性回归2021/8/239回归分析的统计推断Y变异的分解医学统计学一、简单线性回归P
7、(X,Y)XY2021/8/2310总体回归系数的假设检验——t检验注意:在简单线性回归模型中,由于只有一个自变量,回归模型的方差分析等价于对回归系数的检验,且t=。另外,对回归系数的假设检验还有一种方法,即对相关系数作假设检验,在第二节讲到!医学统计学一、简单线性回归2021/8/2311拟合优度检验与决定系数回归系数大小和两个变量的单位及大小有关,回归系数越大,说明Y随X的变化越快,但并不表明影响越大。为描述这种影响的大小以及回归方程拟合效果的好坏,引入决定系数(coeffi
此文档下载收益归作者所有