欢迎来到天天文库
浏览记录
ID:36336681
大小:1.79 MB
页数:128页
时间:2019-05-09
《(医学)北京大学医学部医学统计学进阶1第1讲 多重线性回归与相关》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、多重线性回归与相关王海俊北京大学公共卫生学院主要内容第一节偏相关第二节多元线性回归医学上,许多现象之间都有相互联系,例如:身高与体重、父亲身高与儿子身高、体温与脉搏、产前检查与婴儿体重、乙肝病毒与乙肝等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。关系:可以说乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之间是因果关系;但是,有的现象之间因果不清,只是伴随关系,例如丈夫的身高和妻子的身高之间,就不能说有因果关系。相关就是用于研究和解释两个变量之间相互关系的。复习:直线相关LinearCorrelation一、相关的类型二、相关系数三、相关系数的假设检验为了研究父亲与成年儿
2、子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。一、相关的类型★正相关★负相关★完全正相关★完全负相关★零相关二、相关系数◆样本的相关系数用r(correlationcoefficient)◆相关系数r的值在-1和1之间。正相关时,r值在0和1之间,这时一个变量增加,另一个变量也增加;负相关时,r值在-1和0之间,此时一个变量增加,另一个变量将减少。◆r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱。一个产科医师发现孕妇尿中雌三醇含量与
3、产儿的体重有关。于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出生体重进行预防。因此收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。问尿中雌三醇含量与产儿体重之间相关系数是多少?是正相关还是负相关?分析问题:总体-样本、目的、变量、关系编号(1)尿雌三醇mg/24h(2产儿体重kg(3)编号(1)尿雌三醇mg/24h(2)产儿体重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.4916
4、3.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2待产妇尿雌三醇含量与产儿体重关系SPSS计算程序1.做散点图:GRAPHS-SCATTERT-SIMPLE-DEFINE2.相关分析:ANALYZE--CORRELATION–BIVARIATE-VARIABLES从计算结果可以知道,31例待产妇尿中雌三醇含量与产儿体重之间呈正相关,相关系数是0.61。根据资料类型选择不同的方法计算rPearson:连续变量,双变量正态分布资料Kendall
5、:资料不服从双变量正态分布或总体分布未知,等级资料。Spearman:等级资料问题:我们能否得出结论:待产妇尿中雌三醇含量与产儿体重之间成正相关,相关系数是0.61?为什么?三、相关系数的假设检验上例中的相关系数r等于0.61,说明了31例样本中雌三醇含量与出生体重之间存在相关关系。但是,这31例只是总体中的一个样本,由此得到的相关系数会存在抽样误差。因为,总体相关系数()为零时,由于抽样误差,从总体抽出的31例,其r可能不等于零。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。对相关系数的假设检验,常用t检验,选用统计量t的计算公式如下:
6、=n-2H0:=0H1:≠0=0.05r=0.61,n=31,代入公式t==n-2=31-2=29t=4.14查t值表,t0.05(29)=2.045,查t值表,t0.05(29)=2.045,上述计算t=4.14>2.045,由t所推断的P值小于0.05按=0.05水准拒绝??,接受??认为待产妇24小时内尿中雌三醇浓度与产儿体重之间有正相关关系。另外的例子:识字数,鞋大小游泳票与冰激凌销售量需要排除其它变量的干扰!例题:已知某地29名13岁男童身高X1(cm)、体重X2(kg)和肺活量Y(ml),请计算身高与肺活量,体重与肺活量的相关关系。1、身高与肺活量的简单相关系数2、
7、体重与肺活量的简单相关系数3、身高与体重的简单相关系数第一节偏相关一、概念当有多个变量存在时,为了研究任何两个变量之间的关系,而使与这两个变量有联系的其它变量都保持不变。即控制了其它一个或多个变量的影响下,计算两个变量的相关性。二、偏相关系数偏相关系数是用来衡量任何两个变量之间的关系的大小。当控制一个变量时,偏相关系数的计算公式:当控制多个变量时,偏相关系数的计算公式较为复杂,此处省略。Analyze-----Corre
此文档下载收益归作者所有