资源描述:
《R语言在遗传统计学中的应用.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、遗传与疾病人类的某些性状及部分疾病与人体的遗传因素密切相关阐明遗传因素与人体疾病或健康状态的关系有非常重要的意义遗传统计学在这其中起着至关重要的作用遗传与疾病疾病的易感基因研究研究的特点收集的数据即包含一般的表型数据也包含基因型数据数据分析时需要用到不同的遗传模型需要一些遗传统计特有的分析方法:LD的计算,家系图的绘制等R在遗传统计中的应用数据整理获取位点的基本信息Hardy-Weinberg平衡检验连锁不平衡的计算关联研究常用分析方法家系图的绘制……数据整理R中的genetics包专门为基因型数据提供一个新的类—genotypegenotype函数
2、是genetics包里最基本的函数,可以将以下四种形式的初始基因型数据转换成便于分析的带有genotype类的数据以一个字符分隔的向量g1<-genotype(c('C-C','C-T','C-C','T-T','C-C',''),sep='-')2.可以按某一位置分隔的向量g2<-genotype(c('DD','DI','DD','II',''),sep=1)3.两个分开的向量allele1<-c('D','D','D','I','')allele2<-c('D','I','D','I','')g3<-genotype(allele1,allel
3、e2)4.数据框或矩阵中的两列data<-data.frame(allele1=c('D','D','D','I',''),allele2=c('D','I','D','I',''))g4<-genotype(data$allele1,data$allele2)或data1<-cbind(allele1=c('D','D','D','I',''),allele2=c('D','I','D','I',''))g5<-genotype(data1)获取位点的基本信息多态位点的基本信息包括:位点分型成功率(callrate)、等位基因频率、基因型频率、杂合
4、度和多态信息含量(PIC)一个简单的例子:#载入popn数据data(popn,package="DGCgenetics")#获取A位点的基本信息summary(popn$A)Numberofsamplestyped:1489(96.9%)AlleleFrequency:(2alleles)CountProportion117860.6211920.4NA94NAGenotypeFrequency:CountProportion1/27040.472/22440.161/15410.36NA47NAHeterozygosity(Hu)=0.48026
5、86Poly.Inf.Content=0.3648558Hardy-Weinberg定律Hardy-Weinberg定律是由英国数学家哈迪(D.H.Hardy)和德国医生温伯格(W.Weinberg)于1908年分别独立发现的,也称遗传平衡定律~(geneticequilibriumlaw)该定律可以简单描述为,遗传平衡群体的等位基因频率与基因型频率在世代间维持恒定该定律的适用条件是:随机婚配,群体足够大,没有突变、选择、迁移和遗传漂变Hardy-Weinberg平衡检验关联研究中Hardy-Weinberg平衡检验常被用来评价基因分型的质量。我们通
6、常对病例和对照组分别进行Hardy-Weinberg平衡检验如果某一位点在对照组中不符合Hardy-Weinberg平衡,我们通常会怀疑该位点的基因型鉴定的质量如果该位点在对照组平衡而在病例组出现不平衡,则该位点可能和疾病有关Hardy-Weinberg平衡检验genetics包里面提供两种不同的检验方法一种是Pearson‘schi-squaretest,可以用HWE.chisq函数进行该检验,另一种是Fisherexacttest,对应于HWE.exact函数HWE.chisq常用于MAF较高、样本量较大的场合;MAF较低的位点建议使用HWE.e
7、xact函数LD的计算连锁不平衡则是指人群中两个位点处在同一个单体型的频率比期望值高评价连锁不平衡程度的指标包括D'、r2等genetics包提供计算LD各种指标的函数,并能以文字和图形两种形式显示位点间的连锁不平衡程度LD的计算#用LD函数计算位点间的LDldresult<-LD(popn)#用文字显示D'值summary(ldresult,which="D'")#用图形显示结果LDtable(ldresult,which="D'")PairwiseLD-----------BCDAD'0.9790.9760.976BD'0.9980.991CD'
8、0.997关联研究常用分析方法卡方检验Logistic回归线性回归……卡方检验>data(popn,pack