资源描述:
《多水平模型及其在卫生领域的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、·514·中国慢性病预防与控制2007年10月第15卷第5期ChinJPrevContrChronNon-communDis,October2007,Vol.15,No.5【综述】文章编号:1004-6194(2007)05-0514-02多水平模型及其在卫生领域的应用李佳萌摘要:在卫生领域的研究中,样本一般来自不同的层次和单位,用一般的统计分析方法分析会忽略层次间的差异而影响分析的准确性。多水平模型能同时分析不同层次上的影响因素,在研究的资料有层次结构时,分析得到的结果更加准确可靠。根据研究目的和资料的类型,多水平模型有不同的形式,如多分类离散数据多水平模
2、型、重复测量数据多水平模型、多水平交叉分类模型、双变量多水平模型、非线性多水平模型、多水平时间序列模型等。随着对多水平模型的认识,它在基础医学、临床医学、预防医学等不同卫生领域和医学专业的应用逐渐增多。关键词:多水平模型;卫生领域;应用中图分类号:R195.1文献标识码:E许多社会科学家的研究目的是解释人类行为和态度的变干扰项,影响组间相关。多水平模型诞生之前的一段时间内,研化,以及通过所接触的家庭、学校、工作场所等社会环境后这些究者通常是在个体层上进行回归分析,保存回归系数,并把这些行为是如何改变的。社会科学家虽然利用统计模型分析大量的统计量与第二层所观察
3、的变量混合在一起进行另一个回归分数据来提高他们对社会行为的认识,但是这些应用于社会资料析。这两阶段的方法有时被称做“回归的回归”,基本是多水平模上的统计模型过分注意个体而忽略了个体所在的周围环境。在型的运算原理。尽管进行两次回归的方法在概念上相似,但是统这种情况下,需要一种可以纠正这种忽略个体所在周围环境的计估计和验证方法不同,并且多水平模型的方法更为稳定。大多统计分析方法,它既可以关注个体又可以关注个体所处的环境〔1〕。数线性分析依靠普通最小二乘估计(OLS),多水平模型使用收缩多水平统计模型是有效处理这种资料的统计方法,它是英、美等估计(shinkage
4、estimation),它比使用OLS进行“回归的回归”更为发达国家教育学界20世纪80年代中后期发展起来的一门多元稳定或精确。若某些第二层的单位只有少量的个体样本时,多水统计分析新技术,可有效处理传统多元统计方法难以分析的具平模型用两个估计的加权综合作为最后的估计。其一是来自每有层次结构特征或系统结构特征(hierarchicalorclusterstructure)一个二层单位的OLS估计,另一个是第二层间的加权最小二乘的数据〔2〕。所谓层次结构数据,是指若干单位聚集在不同水平的(WLS)估计。最后的估计是以工作小组的样本大小进行加权,样数据。数据的系统
5、结构现象广泛存在,在教育研究中,学生嵌套本规模较小的更依赖第二层的WLS估计,样本规模较大的更依于学校;家庭研究中,儿童嵌套于家庭;医学研究中,病人嵌套于赖第一层的OLS估计。医生或医院等。层次结构数据也可出现在特殊的研究设计中,例如流行病学调查或社区调查中,按照地区、个人进行分层随机抽2多水平模型的基本形式样,所得数据具有地区和个人两个层次结构。许多实验设计也产根据研究者的研究目的和资料的情况,多水平模型可有不生层次数据,例如新药的多中心试验等〔3〕。同一层次下的个体具同的形式,如:二分类离散数据多水平模型、多分类离散数据多有层内相似性,而以往对于这种数据
6、的处理通常采用忽略层次水平模型、重复测量数据多水平模型、多水平交叉分类模型、双结构、根据高层次单位分别拟合模型和把高层次单位设置哑变变量多水平模型、非线性多水平模型、多水平时间序列模型等。量的方法,这些方法损失了数据所蕴含的部分信息,不能较好地但其基本的形式包括3个公式〔1〕:解释相应的现象,甚至得到错误的结论〔2,4〕。多水平模型将数据的Y=β+βX+r(1)ij0j1jijij不同层次设置为不同水平,将低水平的随机误差分解到数据系β0j=γ00+μ0j(2)统结构的相应水平上,并将高水平单位的参数估计作为随机变β1j=γ10+μ1j(3)量,估计随机效应
7、,同时也能提高水平单位所代表的潜在总体特式中:i—第一层的个体如学生、病人;j—第一层的个体所属的第征的信息〔5〕。二层的单位,如学校、班级;γ—β的平均值;γ—β的平均值,000j101j并且它们在第二层的单位之间是恒定的,他们是β0j和β1j的固1多水平模型的原理〔6〕定成分;μ—β的随机成分;μ—β的随机成分,它们代表第二0j0j1j1j传统的线性模型的基本假设是线性、正态、方差齐性及独层单位之间的变异。立,后两条的假设在镶嵌形的取样中往往不能成立,同组内的个方差和协方差为:体比不同组的个体之间更接近或者相似。不同组的抽样可能是Var(μ0j)=τ00
8、(4)独立的,但是同组内的抽样在很多变量上可能取值相