统计学教程相关与回归

统计学教程相关与回归

ID:40775993

大小:379.11 KB

页数:46页

时间:2019-08-07

统计学教程相关与回归_第1页
统计学教程相关与回归_第2页
统计学教程相关与回归_第3页
统计学教程相关与回归_第4页
统计学教程相关与回归_第5页
资源描述:

《统计学教程相关与回归》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、相关与回归第九讲王晓莉相关与回归1基本内容统计描述统计推断应用计量资料频数分布集中趋势离散趋势统计图表抽样误差、标准误tuF检验正常值范围区间估计计数资料相对数及其标准化统计图表标准误2检验率的区间估计人口统计疾病统计相关与回归rb统计图表t检验相关与回归2医学上,许多现象之间都有相互联系,例如:身高与体重、父亲身高与儿子身高、体温与脉搏、产前检查与婴儿体重、乙肝病毒与乙肝等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。相关与回归3变量之间的关系:乙肝病毒感染是前因,得了乙肝是后果,

2、乙肝病毒和乙肝之间是因果关系;有的现象之间因果不清,只是伴随关系,例如丈夫的身高和妻子的身高之间,就不能说有因果关系。相关与回归4相关与回归就是用于研究和解释两个变量之间相互关系的。相关与回归5主要内容第一节直线相关第二节直线回归第三节注意事项相关与回归6第一节直线相关一、相关的类型二、相关系数相关系数的计算公式相关系数的假设检验三、直线相关的意义相关与回归7为研究父亲与成年儿子身高之间的关系,皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上。X上的数代表父亲身高,Y上的数代表儿子的身

3、高1078个点形成图形是一个散点图。相关与回归8散点图为了确定相关变量之间的关系,收集一些数据,这些数据是成对的;然后在直角坐标系上描述这些点,这一组点集称为散点图。相关与回归9相关的类型★正相关★负相关★完全正相关★完全负相关★称零相关相关与回归10相关系数样本的相关系数用r表示r的值在-1和1之间;r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱;正相关时,r值在0和1之间,这时一个变量增加,另一个变量也增加;负相关时,r值在-1和0之间,此时一个变量增加,另一

4、个变量将减少。相关与回归11相关系数的计算公式相关与回归12一个产科医师发现孕妇尿中雌三醇含量与产儿的体重有关;于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出生体重进行预防。因此收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。问尿中雌三醇含量与产儿体重之间相关系数是多少?是正相关还是负相关?分析问题:总体-样本、目的、变量、关系相关与回归13编号(1)尿雌三醇mg/24h(2产儿体重kg(3)编号(1)尿雌三醇mg/24h(2)产儿体重kg(3)172

5、.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.722153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2待产妇尿雌三醇含量与产儿体重关系14∑X=534∑Y=99.2∑X2=9876∑Y2=324.8∑X

6、Y=1750N=31相关与回归15计算结果r的值说明了两个变量X与Y之间关联的密切程度(绝对值大小)与关联的性质(正负号)。相关与回归16问题:我们能否得出结论:待产妇尿中雌三醇含量与产儿体重之间成正相关,相关系数是0.61。为什么?从计算结果可以知道,31例待产妇尿中雌三醇含量与产儿体重之间程正相关,相关系数r=0.61。相关与回归17相关系数的假设检验上例中的相关系数r等于0.61,说明了31例样本中雌三醇含量与出生体重之间存在相关关系。但是,这31例只是总体中的一个样本,由此得到的相关系数会存

7、在抽样误差。因为,总体相关系数()为零时,由于抽样误差,从总体抽出的31例,其r可能不等于零。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。相关与回归18相关系数的假设检验,常用t检验,选用统计量t的计算公式如下:=n-2相关与回归191.H0:=0H1:≠02.=0.053.t==n-2=31-2=29t=4.144.确定P值:查t值表,t0.05(29)=2.045t=4.14>2.045,由t所推断的P值小于0.055.结论:按=0.

8、05水准拒绝??,接受??,认为临产妇24小时内尿中雌三醇浓度与产儿体重之间有正相关关系。相关与回归20直线相关的意义在确实存在相关关系的前提下(??),如果r的绝对值越大,说明两个变量之间的关联程度越强,那么,已知一个变量对预测另一个变量越有帮助;如果r绝对值越小,则说明两个变量之间的关系越弱,一个变量的信息对猜测另一个变量的值无多大帮助。一般说来,当样本量较大,并对r进行假设检验,有统计学意义时,r的绝对值大于0.7,则表示两个变量高度相关;r的绝对值大于0.4,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。