欢迎来到天天文库
浏览记录
ID:31374513
大小:109.00 KB
页数:7页
时间:2019-01-09
《病例对照研究中基因型关联分析方法的比较》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、病例对照研究中基因型关联分析方法的比较 摘要:在遗传流行病学研究中,常采用病例对照设计分析某个或某些遗传标记与疾病的关联,所用方法有Pearson卡方检验、Cochran-Armitage趋势检验、哈代-温伯格不平衡检验和对遗传模型稳健的检验方法等,这些方法各自有其优势和劣势,该文对它们的原理进行简明扼要地介绍,并比较它们的异同及各自的适用条件。 关键词:病例对照研究遗传标记关联分析 中图分类号:R954文献标识码:A文章编号:1672-3791(2016)03(b)-0110-03 基于病例对照数据进行关联分析,Pearson卡方检验和Cochran-Armitag
2、e趋势卡方检验是两种较为常用的检验方法(分别简称为卡方检验和趋势卡方检验),2006年Song和Elston[1]又提出哈代-温伯格不平衡检验(Hardy-Weinbergdisequilibriumtest,简记为HWDT),它们都是基于基因型的传统检验方法。在实际研究中,由于基因的遗传模型通常是未知的,研究者们又发展出对遗传模型稳健的检验方法。 1Pearson卡方检验 Pearson卡方检验是KarlPearson提出的一种应用范围很广的统计方法。对于R×C表资料,卡方检验公式为 其中,Oi,是第i个格子的实际频数,Ei是理论频数。7 表1为单位点病例对照基因型
3、数据,A和a为某位点上的两个等位基因,并假设A为风险等位基因,对应的3种基因型分别为aa、Aa和AA,也可记为G0、G1和G2(下标代表基因型中风险等位基因的个数)。R和S分别为病例组和对照组的样本数,r0、r1、r2为病例组中每种基因型对应的人数,s0、s1、s2为对照组中每种基因型对应的人数,,。ni为病例组和对照组的基因型Gi的合计数,ni=ri+si,i=0,1,2,N为两组样本数之和。(r0,r1,r2)和(s0,s1,s2)分别服从M(R,p0,p1,p2)和M(S,q0,q1,q2)的多项分布,和为病例组和对照组的基因型概率分布。 对于表1的数据,Pearso
4、n检验可以表示为 在H0成立条件下,即pi=qi,ZCHI服从自由度为2的卡方分布。对备择假设无其他具体信息的情况下,卡方检验是最有效的稳健性检验。 2趋势卡方检验 趋势卡方检验是Cochran和Armitage在20世纪中叶提出的用于等级数据相关性的检验。对于表1中的数据,若疾病发生的概率随着基因型中风险等位基因的个数增加而升高,那么这个数据就是等级数据。趋势检验考虑了等级信息并试图利用这个信息提高检验效能。假设基因型Gi的分值为xi,i=0,1,2。趋势卡方检验比较病例组和对照组基因型概率的加权和(权为每个基因型的计分),即与0相比差异是否有统计学意义。令: 在H
5、0成立条件下将作为对pi和qi的估计,V代入方差公式即得,进而得出H0成立时,检验统计量ZCAT近似服从自由度为1的卡方分布。 虽然趋势卡方检验依赖于分值(x0,x1,x2)的选取,但是对于分值的线性变换趋势检验的结果是恒定的,因此可令,≤≤71,即将基因型aa和AA的分值分别固定为0和1,杂合子基因型Aa的分值为x,分值的变化主要体现在x的变化上。为体现趋势卡方检验对x的依赖性,分值为(0,x,1)时检验为: 分值的选取很重要但也相当困难,对于多态位点基因型分值的选取则是难上加难。对于二态位点3个基因型分值的选取,当和时分别为隐性模型和显性模型下的最优计分,是加性模型下
6、趋势检验的局部最优计分。基因型的计分为时,趋势卡方检验等价于卡方检验。 3哈代-温伯格不平衡检验 哈代-温伯格平衡是在满足随机交配、群体同质且群体足够大等一系列假定下成立的遗传定律,然而在实际研究中特定的研究群体通常偏离哈代-温伯格平衡。这种偏离在遗传学上通常用哈代-温伯格不平衡系数来体现。常用的哈代-温伯格不平衡系数有两种,即用基因型频率的比值定义的哈代-温伯格不平衡系数和用基因型频率的差来定义的哈代-温伯格不平衡系数。对于二态的位点,这两种不平衡系数分别为 这两种定义都是合理且常用的定义方式,但是它们各有其应用条件和优势。 当哈代-温伯格平衡在某个群体中成立时,式
7、(5)的δ应为0。定义病例组和对照组的哈代-温伯格不平衡系数分别为δ1和δ0,当H0成立时δ1=δ0=δ0,因此当δ=0时,δ1和δ0之间的差异可以用来判断基因型是否与疾病关联,由此引出哈代-温伯格不平衡检验,其检验统计量如下:7 在H0成立的条件下,Zhwd近似服从标准正态分布。在实践中,用Zhwd来检验基因型是否与疾病关联检验效能通常比较低,特别是当真正的遗传模型为乘积模型时,该检验的效能几乎为零。但是研究发现,虽然Zhwd不是一个理想的检验关联性的统计量,但是它可以被用于基因型数据的质量控制,判
此文档下载收益归作者所有