资源描述:
《整群随机化试验设计样本例数估计_郭静》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、中国卫生统计2008年4月第25卷第2期·117·*整群随机化试验设计样本例数估计中国疾病预防控制中心信息中心(100050)郭静金水高【提要】目的探讨两阶段整群随机化设计两组比较样本例数估计方法。方法通过估计组内相关系数,根据设计效应及群的大小估计样本例数。结果本文给出了计量和计数两种情况下的样本含量估计公式。结论在整群随机化设计中,数据由于隶属关系而存在聚集性,表现为至少两个水平的层次结构及组内相关性,因此在设计阶段需对其设计效应进行估计,进而估计其样本例数。【关键词】整群随机化样本例数组内相关性设计效应整群随机化试验(clusterrand
2、omizationtrial)是指若忽略数据的层次结构或者分层(如按地区)对数将社会单元或由个体组成的整群随机化分配到不同的据进行处理,或者把高层次因素设置成哑变量分析,都处理组。Cornfield首先提出卫生研究领域中整群随机将导致分析结果一定程度的偏差,甚至得到错误的结化的统计学特点,即:随机化单位与分析单位不一致,论等。多水平模型正是为了处理这类层次结构数据而〔1〕而这正是该设计与一般试验设计的主要区别所在。发展起来的一种方法,此方法充分考虑了数据的层次在这些单元中对个体的分组或分层,使得不能直接应结构性,把传统的线性模型不仅分解成固定部分
3、和随用传统的样本例数估计和统计分析等方法。机部分,而且进一步把随机部分分解到数据的不同层该方法主要适用于非治疗性干预评价研究,如生次上,从而能得到每个层次上的解释信息,使分析更完〔2〕活模式的改变等。在这些研究中,随机化的单位可以善,更合理准确。不同,可以是相对较小的组,如家庭,或整个社区,也可基本原理以是工地、医院、班级等。也有报告不常见的较大的随机化单位,如运动队、部落、宗教组织等。以两水平情况为例,个体为第1水平,群为第二水平。简介1.多水平模型1.整群结构一般模型的建立及估计:多水平模型的基本模型〔3〕许多科研工作中收集的资料都具有层次或
4、整群结可简记为:构(hierarchicalorclusteredstructure),其基本特征是y=xβ+z(2)u+z(1)e(1)数据由于隶属关系而存在聚集性(clustering),表现为其中等式右边的第1项为模型的固定效应部分,至少两个水平(levels)的层次结构。例如,在现场流行x为解释变量向量,β为固定效应向量;后两项都为随病学调查中,大多采用多阶段随机抽样的方法获取数机效应部分,u、e分别为第2水平、第1水平上的随机据,如先随机抽取若干个省,再抽取省下面的县,县下效应向量,z(2),z(1)为相应的设计矩阵。此模型假面的乡,乡
5、下面的村,直到家庭或个体等。显然这样的设:cov(u,e)=0,即两水平上的残差相互独立;且u数据具有层次结构性,而同一层次内的个体具有层内~N(0,Ψu),Ψu=cov(u);e~N(0,Ψe),Ψe=cov相似性,其生理和心理等特征较从一般总体中随机抽(e)。取的个体趋向于更为相似。该模型是通过迭代方法首先得到随机效应矩阵许多试验设计也产生了层次数据。例如,在几个Ψu、Ψe的估计值,然后得到固定效应向量β的估计随机选择的中心或组进行的临床试验。所谓层次是指值,最后得到第2水平残差的估计值。2.组内相关性(theintraclasscorrel
6、ation,ICC)若干单位聚集在不同的水平。例如,子女是一个两水组内相关系数ICC(intracluster/intraclasscorrela-平结构中的水平1单位(microunit),这里,水平2单位(macrounit)即家庭。学生是学校中的水平1单位,tioncoefficient)反映同一整群内个体间的相似程度,用〔4〕ρI表示,解释为:组间变异占总变异的比重。这里,学校即水平2单位。2.多水平模型ρI=Corr(yij,yi′j)22σBσB=2=22(i≠i′)(2)*本项目获美国国立卫生研究院(NIH)和美国国立变态反应和传染
7、病σT(σB+σW)222研究院(NIAID)联合资助其中,σB为组间变异,σW为组内变异,σT为总变异。·118·ChineseJournalofHealthStatistics,Apr2008,Vol.25,No.2nNjfactor)。采用不同的抽样设计方法,所需的样本例数212σW=M-N∑∑(Yij-Y.j)不同,当总样本例数相同时,按照所采用的抽样方法计j=1i=1N算得到的方差与采用单纯随机抽样方法计算得到的方12=M-N∑(nj-1)Sj(3)差之比称为设计效应。对于两阶段整群随机化设计,j=1其设计效应计算公式为:njS212D
8、E=1+(nj-1)×ρI(9)j=n∑(Yij-Y.j)(4)j-1i=1两阶段随机抽样中,设计效应随着组内相关系数N212ρI以及每