两变量的关联性分析

两变量的关联性分析

ID:40408133

大小:951.06 KB

页数:59页

时间:2019-08-01

两变量的关联性分析_第1页
两变量的关联性分析_第2页
两变量的关联性分析_第3页
两变量的关联性分析_第4页
两变量的关联性分析_第5页
资源描述:

《两变量的关联性分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Healthstatistics卫生统计学---两变量关联性分析统计方法回顾身高凝血酶浓度t检验两个总体均数相等方差分析多个总体均数相等上网时间满意度婴儿腹泻ABO血型研究目的:组间比较秩和检验两个(多个)总体中位数相等检验,确切概率法两个(多个)总体概率分布相同研究目的:两随机变量间的关系上网时间和考试分数的关系收入和生活满意度的关系婴儿腹泻和婴儿喂养方式的关系ABO血型和MN血型的关系线性相关(双变量正态分布资料)秩相关(偏峰分布、分布未知、等级资料)分类变量的关联性分析(二分类和无序多分类资料)身高和体重的关系凝血酶浓度和凝

2、血时间的关系线性相关(linearCorrelation)秩相关(rankcorrelation)分类变量的关联性分析outline线性相关(linearCorrelation)KarlPearson1857-1936SirFrancisGalton1822-1911线性相关研究两个随机变量间有无直线相关关系,相关的方向及密切程度。条件:双变量正态分布散点图相关系数XY正相关(PositiveCorrelation)XY负相关(NegativeCorrelation)XY非线性相关XY零相关(zeroCorrelation)线性相

3、关系数Pearson积差相关系数——描述两个变量间相关关系的密切程度与相关方向的指标。r:样本相关系数ρ:总体相关系数线性相关系数去单位Y的离均差平方和:X的离均差平方和:X与Y间的离均差积和:线性相关系数的计算相关系数的性质方向(direction)r>0为正相关;r<0为负相关;r=0为零相关。大小(strength)|r|越接近于1,说明相关性越好;|r|越接近于0,说明相关性越弱。例11-1随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间,数据如表11-1所示。据此数据如何判断这两项指标间有否相关?受试

4、者号123456789101112131415凝血酶浓度1.11.21.00.91.21.10.90.61.00.91.10.91.11.00.7凝血时间141315151314161714161516141517表11-115名健康成人凝血时间与凝血酶浓度测量值记录0.50.60.70.80.91.01.11.21.318171615141312凝血酶浓度(毫升)凝血时间(秒)233图115例健康成人的凝血酶浓度和凝血时间散点图1.画散点图线性相关?2.计算线性相关系数负相关Question:Whetherρ=0ornot?XY

5、3.相关系数的假设检验3.相关系数的假设检验查表法:r界值表(附表13)t检验建立检验假设,确定检验水准H0:凝血酶浓度与凝血时间无直线相关关系,即ρ=0H1:凝血酶浓度与凝血时间有直线相关关系,即ρ≠0=0.05相关系数的假设检验查表法t检验法计算检验统计量,确定p值相关系数的假设检验相关系数的假设检验—查表法r界值表r=-0.926,v=15-2=13概率,Pυ单0.025双0.050.0050.010.00050.001100.5760.7080.823110.5530.6840.801120.5320.6610.7801

6、30.5140.6410.760140.4970.6230.742P<0.05本例相关系数的假设检验—t检验00.0250.025-2.162.16-8.8748.874作出统计推断结论P<0.05,按α=0.05检验水准拒绝H0,差别有统计学意义,可认为凝血酶浓度与凝血时间之间存在线性相关。相关系数的假设检验线性相关分析画散点图:判断有无线性趋势计算线性相关系数:相关性大小和方向线性相关系数的假设检验:根据样本相关系数r推断总体相关系数ρ线性相关应用中应注意的问题1散点图的重要性r=0.816线性相关应用中应注意的问题2要求两变

7、量都是随机变量,且为双变量正态分布资料。r=0.08r=0.85XYXY线性相关应用中应注意的问题3出现异常点时慎用相关线性相关应用中应注意的问题4相关未必是因果关系线性相关应用中应注意的问题5分层资料盲目合并易出假象(a)(b)(c)线性相关(linearCorrelation)秩相关(rankcorrelation)分类变量的关联性分析outline秩相关也称等级相关,最常用的Spearman秩相关。资料类型不服从正态分布的资料总体分布未知的资料等级资料原理利用两变量的秩次作线性相关分析,对原变量的分布不作要求,属非参数统计方

8、法。例11-4某地研究2~7岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见表11-2,试用秩相关进行分析。秩相关分析编秩计算lpp、lqq、lpq计算Spearman秩相关系数或等级相关系数,用rs表示。负相关?Spearman秩相关

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。