欢迎来到天天文库
浏览记录
ID:58024317
大小:900.50 KB
页数:70页
时间:2020-09-04
《多层统计分析模型.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、多层统计分析模型陶庄中国CDC卫生统计研究室绪论青蛙与池塘(“Frog-pondtheory”)青蛙—学生个体;池塘—学校环境;学生的成绩好坏不仅受到个体本身的影响,也受到学校环境的影响!多层数据低一层(低水平)单位(个体)的数据嵌套(nested)于高一层(高水平)的单位(组群)之中。结局变量,个体解释变量,场景变量(contextualvariables)组内观察相关(within-groupobservationdependence)同一组内的个体,较不同组的个体而言,在观念、行为等很多方面更为接近或相似;即便不是刻意分组,也是如此。组内同质(withi
2、n-grouphomogeneity),组间异质(between-groupheterogeneity)很小的相关将导致很大的I类错误。多层数据的常见来源复杂抽样;多中心临床试验;纵向研究(longitudinalstudies)与重复测量(repeatedmeasures);“高低搭配”;Meta分析;……多层统计模型的研究内容哪些个体解释变量会影响结局变量;哪些场景变量会影响结局变量;个体解释变量对结局变量的影响是否会受到场景变量的影响。多层统计模型出现前对多层数据进行分析的探索探索(1)—分别估计在个体水平和组群水平分别进行分析;试图用单一的个体水平模型
3、的分析结果来推论另一水平的统计结果。探索(2)—传统回归用传统的固定效应回归模型中一般的交互项理解多层数据中的跨层(cross-level)交互作用。探索(3)—两步模型(two-stagemodel)第一步模型,对各组分别进行同一回归模型估计,获得一系列的系数;对这些系数的恒定性进行检验;如果不恒定,则进行第二步模型,以组变量为因变量,系数为自变量进行回归。探索(3)—两步模型的问题无论哪一步均使用OLS,并不适用;当组群过多,则十分麻烦;某些组内样本量很少时,进行回归不稳定;将每个组群认为是不相关的,忽略了其为从一大样本中抽取的事实。多层统计模型的出现研
4、究的学者很多;系统的主要为两;研究的理论没有根本上的分歧;双方研究成果的发布时间基本相同(上世纪80年代末90年代初);分别有各自分析的成熟的软件;目前,大家基本上接受两组人分别独立开发出同一模型的结果。S.Raudenbush与A.Bryk模型称为:hierarchicallinearmodel;软件为:HLMH.Goldstein模型称为:multilevelmodels;软件为:MLwiN(早期版本称ML3,MLn)多层统计模型的名称multilevelmodelshierarchicallinearmodelrandom-effectmodelrand
5、omcoefficientmodelvariouscomponentmodelmixed-effectmodelempiricalBayesmodel多层统计模型的优点同时分析组效应和个体效应;不需有独立性假设;对稀疏(sparse)数据,即每组样本很少的数据,特别有效;特别适合对发展模型(GM)的分析。多层统计模型的局限性(1)模型复杂,不够简约;需较大样本以保证稳定性;组群数量较少,会出现偏倚;高水平单位并非严格抽样获得;某些场景变量通常是各组个体的聚集性测量,而不是总体内个体的聚集性测量;多层统计模型的局限性(2)研究对象一般具有流动性,即受到群组影响的
6、程度不同,虽可用出入时间进行控制,但此信息一般不可知;依然存在自变量带有测量误差的问题,必需借助于结构方程模型(SEM);完全嵌套假设,即每一个低水平单位嵌套、且仅嵌套于一个高水平单位。用于多层统计模型的软件专门软件:HLM;MLwiN;SuperMIX;aML;EGRET;LISREL;Mplus等。通用统计学软件:SAS;SPSS;stata;S-plus/R等。线性多层统计模型基础知识组内相关系数(Intra-ClassCorrelationCoefficient,ICC)组间方差占总方差的比例。可使用对“空模型”的拟合获得;值域在0到1之间,越接近1,
7、说明相关越明显;对ICC的检验是是否选择多层模型的依据。两水平模型的公式表达空模型(又称截距模型)两个水平1自变量、一个水平2自变量一般模型SAS中的公式表达模型假设模型假设—SAS的表达固定和随机回归系数模型估计方法最大似然法(ML)包括普通最大似然法(ML)和限制性最大似然法(REML);两者用于估计的残差基础不同,后者的残差包括所有的随机变异;REML是SAS的MIXED过程和HLM的默认算法;REML通常用于组数量较少的模型;ML可以用于模型比较,而REML不行;REML估计较优,而ML较快。最小二乘法(LS)包括迭代广义最小二乘法(IGLS)和限制性
8、迭代广义最小二乘法(RIGLS)都以普
此文档下载收益归作者所有