多水平统计模型研究生

多水平统计模型研究生

ID:27667736

大小:416.01 KB

页数:76页

时间:2018-12-02

多水平统计模型研究生_第1页
多水平统计模型研究生_第2页
多水平统计模型研究生_第3页
多水平统计模型研究生_第4页
多水平统计模型研究生_第5页
资源描述:

《多水平统计模型研究生》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多水平统计模型简介ABriefIntroductionto MultilevelStatisticalModels概述层次结构数据的普遍性经典方法及其局限性基本多水平模型多水平模型的应用多水平主成分分析多水平因子分析多水平判别分析多水平logistic回归多水平Cox模型多水平Poisson回归多水平时间序列分析多元多水平模型多水平结构方程模型MLwiN(1999)SAS(Mixed)SPSSSTATA两水平层次结构数据水平2水平1层次结构数据的普遍性“水平”(level):指数据层次结构中的某一层次。例如,子女为低水平即水平1

2、,家庭为高水平即水平2。“单位”(unit):指数据层次结构中某水平上的一个实体。例如,每个子女是一个水平1单位,每个家庭是一个水平2单位。临床试验和动物实验的重复测量多中心临床试验研究纵向观测如儿童生长发育研究流行病学现场调查如整群抽样调查遗传学家系调查资料meta分析资料层次结构数据非独立数据,即某观察值在观察单位间或同一观察单位的各次观察间不独立或不完全独立,其大小常用组内相关(intra-classcorrelation,ICC)度量。例如,来自同一家庭的子女,其生理和心理特征较从一般总体中随机抽取的个体趋向于更为相似,

3、即子女特征在家庭中具有相似性或聚集性(clustering),数据是非独立的(nonindependent)。非独立数据不满足经典方法的独立性条件,采用经典方法可能失去参数估计的有效性并导致不合理的推断结论。但非独立数据的组内相关结构各异,理论上,不同的结构应采用相应的统计方法。如纵向观测数据常用广义估计方程(GEE),但有两个局限性:一是对误差方差的分解仅局限于2水平的情形,二是没有考虑解释变量对误差方差的影响。当应变量的协差阵为分块对角阵时,一般采用多水平模型。经典方法框架下的分析策略经典的线性模型只对某一层数据的问题进行分

4、析,而不能将涉及两层或多层数据的问题进行综合分析。但有时某个现象既受到水平1变量的影响,又受到水平2变量的影响,还受到两个水平变量的交互影响(cross-levelinteraction)。个体的某事件既受到其自身特征的影响,也受到其生活环境的影响,即既有个体效应,也有环境或背景效应(contexteffect)。例如,个体发生某种牙病的危险可能与个体的遗传倾向、个体所属的社会阶层(如饮食文化和口腔卫生习惯)、环境因素(如饮水中氟浓度)等有关。分解(disaggregation)聚合(aggregation)分解:不满足模型独立

5、性假定,回归系数及其标准误的估计无效,且未能有效区分个体效应与背景效应。另一种分析策略是用哑变量拟合高水平单位的固定效应。聚合:损失大量水平1单位的信息,更严重的是可能导致“生态学谬误”(ecologicalfallacy)。多水平分析的概念为人们提供了这样一个框架,即可将个体的结局联系到个体特征以及个体所在环境或背景特征进行分析,从而实现研究的事物与其所在背景的统一。经典模型的基本假定是单一水平和单一的随机误差项,并假定随机误差项独立、服从方差为常量的正态分布,代表不能用模型解释的残留的随机成份。基本的多水平模型当数据存在层次

6、结构时,随机误差项则不满足独立常方差的假定。模型的误差项不仅包含了模型不能解释的应变量的残差成份,也包含了高水平单位自身对应变量的效应成份。多水平模型将单一的随机误差项分解到与数据层次结构相应的各水平上,具有多个随机误差项并估计相应的残差方差及协方差。构建与数据层次结构相适应的复杂误差结构,这是多水平模型区别于经典模型的根本特征。多水平模型由固定与随机两部分构成,与一般的混合效应模型的不同之处在于,其随机部分可以包含解释变量,故又称为随机系数模型(randomcoefficientmodel),其组内相关也可为解释变量的函数。换

7、言之,多水平模型可对不同水平上的误差方差进行深入和精细的分析。1.方差成份模型(VarianceComponentModel)假定一个两水平的层次结构数据,医院为水平2单位,患者为水平1单位,医院为相应总体的随机样本,模型中仅有一个解释变量x。和分别为第j个医院中第i个患者应变量观测值和解释变量观测值,和为参数估计,为通常的随机误差项。示水平2单位示水平1单位与经典模型的区别在于。经典模型中的估计为,仅一个估计值,表示固定的截距,而在方差成份模型中表示j个截距值,即当x取0时,第j个医院在基线水平时y的平均估计值。为平均截距,反

8、映与的平均关系,即当x取0时,所有y的总平均估计值。为随机变量,表示第j个医院y之平均估计值与总均数的离差值,反映了第j个医院对y的随机效应。表示协变量x的固定效应估计值。即y与协变量x的关系在各医院间是相同的,换言之,医院间y的变异与协变量x的变化无关。方差成

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。