欢迎来到天天文库
浏览记录
ID:62178204
大小:554.50 KB
页数:78页
时间:2021-04-20
《最新统计学方法的分类与选择-重点知识教学讲义ppt.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、统计学方法的分类与选择-重点知识根据研究设计类型选择分析方法(一)、成组比较的设计在成组比较设计中,若是两组比较需要应用t检验或X2检验。多组比较需应用方差分析、行×列表X2检验或分级的分析方法。根据变量的类型选择分析方法区别与明确研究的因变量和自变量具有重要的流行病学与生物统计学意义,首先它有助于选择拟研究的变量,对调查表的设计具有指导作用。其次数据分析阶段可以指导数据分析方法的选择及模型的建立。若因变量是分类变量,则常考虑应用分类变量的分析方法,如卡方检验,logistic回归分析等。如果因变量是数值变量,则考虑应用数值变量的分析方法如t检验、方差分析,
2、协方差分析、多元回归等。同时明确自变量与因变量可以建立正确的统计学分析模型。因变量应该放在模型的左侧,自变量则放在模型的右侧。例如欲评价不同治疗方法(口服药物、注射胰岛素及膳食控制)对糖尿病人的治疗效果(血糖水平),在分析时要求调整病人的性别、年龄和病程的影响。对本例的处理需要进行协方差分析,在应用SAS进行分析时,要将血糖水平(因变量)放在模型的左则,而治疗方法或其它协变量(covariate)即性别、年龄和病程放在模型的右侧。又如分析脂蛋白(a)与冠心病发生的关系,则冠心病是否发生为因变量,脂蛋白(a)则为自变量,不可颠倒这种关系。不同变量类型的数据分析
3、方法选择不同研究设计和数据类型的数据分析方法选择数据的分析程序数据的转换1)非正态数据的变量转换多数的统计学分析方法是建立在数据正态分布的基础上的,若数据不符合正态分布,则不能够应用参数检验(parametrictest)的方法,只能应用非参数检验(non-parametrictest)的方法,而非参数的方法不是对原始数据的检验,如秩和检验就是非参数检验方法之一,它是对原始数据的秩次(rank)进行检验,这样可能损失数据信息,降低检验效率在对数值变量进行分析时,需首先根据统计分析方法/统计分析公式的限制性使用条件对数据进行“条件”检验,如正态性检验和方差齐性
4、检验等。很多统计学软件具有方便的正态性检验、方差齐性检验功能如SAS软件等.若经过检验数据不符合使用条件,就需要进行数据的变量变换,变换后符合条件就可以应用参数检验的方法,否则,只有应用非参数检验的方法。数据变量转换的方法很多,可以根据数据的分布特征,选择合适的数据转换方法。常用的方法有对数变换,平方根变换或倒数变换等。2)分类变量转换成哑变量若分类变量是二分类尺度及顺序尺度,则可直接应用其原有的数量化数值,但对于名义尺度因为各类别间没有顺序关系,在进行不同分析(包括多元分析、logistic回归、Cox回归等)时,不能使用原始的计算机录入数值,必经进行变量
5、转换。即将该变量转换成(水平数-1)个哑变量,再将这些新转换的变量放入多因素模型中。t检验的应用条件两组数据的比较1样本量比较小(n<50);2样本来自正态总体;3两样本总体方差齐同;当两样本方差不齐时可以采用t’检验,变量变换,或者秩和检验。u检验两组数据的比较1样本量足够大(n>50)2样本来自正态总体3两样本总体方差齐同当两样本方差不齐时可以采用t’检验,变量变换,或者秩和检验。方差分析的应用条件两组以上数据的比较1各样本是相互独立的随机样本;2各样本要来自正态总体;3要求各个样本的总体方差齐同。多个样本均数间的两两比较Newman-Keuls检验,亦
6、称Student-Newman-Keuls(SNK)检验,简称q检验。最小显著性差距(LSD)t检验。协方差分析定量分析中,进行两个样本或者多个样本的均数比较时,不仅需要使用假设检验判断其差异是否具有统计学差异,还应该考虑他们之间是否存在混杂因素(协变量)的影响。若存在协变量,则应该通过协方差分析进行校正。协方差分析是定量变量分析中控制混杂因素的重要手段影响观察指标的其他非研究性因素(混杂因素)在统计分析中又称之为协变量;考虑协变量影响的方差分析即为协方差分析。协方差分析是解决以上问题的分析方法,它将线性回归与方差分析结合起来,检验2个或者多个修正均数之间有
7、无差别的假设检验方法。一般是先用直线回归的方法找出各组因变量与协变量之间的数量关系,求得修假定协变量相等时的修正系数,然后用方差分析比较修正均数间的差别。协方差分析的条件1各个样本来自方差齐同的正态总体2各组的总体直线回归系数相同,且都不为0。协方差分析的判别步骤:1正态性和方差齐性检验;2判断协变量与因变量有无线性关系;3判断各组回归直线是否平行。直线回归与相关的区别与联系多元线性回归的基本概念事物间的相互联系往往是多方面的,在很多情况下对应变量y发生影响的自变量往往不止一个。多元线性回归的目的就是用一个多元线性回归方程表示多个自变量和1个应变量间的关系。
8、标准偏回归系数表示其他自变量固定的情况下,xi改变一
此文档下载收益归作者所有