资源描述:
《SNP及检测技术》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、1定义:单核苷酸多态性(singlenucleotidepolymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失所致。但通常所说的SNP并不包括后两种情况。单核苷酸多态性(SNP)是指在基因组上单个核苷酸的变异,包括置换、
2、颠换、缺失和插入。所谓转换是指同型碱基之间的转换,如嘌呤与嘌呤(G2A)、嘧啶与嘧啶(T2C)间的替换;所谓颠换是指发生在嘌呤与嘧啶(A2T、A2C、C2G、G2T)之间的替换。从理论上来看每一个SNP位点都可以有4种不同的变异形式,但实际上发生的只有两种,即转换和颠换,二者之比为2:1。SNP在CG序列上出现最为频繁,而且多是C转换为T,原因是CG中的C常为甲基化的,自发地脱氨后即成为胸腺嘧啶。一般而言,SNP是指变异频率大于1%的单核苷酸变异。在人类基因组中大概每1000个碱基就有一个SNP,人类基因组上的SNP总量大概是3×106个。依据排列组合原理,SNP一共可以有6种替换情况,即A
3、/G、A/T、A/C、C/G、C/T和G/T,但事实上,转换的发生频率占多数,而且是C2T转换为主,其原因是CpG的C是甲基化的,容易自发脱氨基形成胸腺嘧啶T,CpG也因此变为突变热点。理论上讲,SNP既可能是二等位多态性,也可能是3个或4个等位多态性,但实际上,后两者非常少见,几乎可以忽略。因此,通常所说的SNP都是二等位多态性的。这种变异可能是转换(CT,在其互补链上则为GA),也可能是颠换(CA,GT,CG,AT)。转换的发生率总是明显高于其它几种变异,具有转换型变异的SNP约占2/3,其它几种变异的发生几率相似。Wang等的研究也证明了这一点。转换的几率高,可能是因为CpG二核苷酸上
4、的胞嘧啶残基是人类基因组中最易发生突变的位点,其中大多数是甲基化的,可自发地脱去氨基而形成胸腺嘧啶。SNP在动物基因组中分布广泛,每一个核苷酸发生突变的概率大约为10-9。由于选择压力,SNP在单个基因、整个基因组中以及种群间的分布是不均匀的。SNP在非编码区中要多于编码区,而且在编码区也是非同义突变(有氨基酸序列的改变)的频率比其他方式突变的频率低得多[4]。而基因间,同一种基因中的编码SNP(codingSNP,cSNP)的数目也不相同,可从0~29个不等。多项研究同时发现不同种族间SNPs的数目也是不同的,非洲人群及非裔种族中SNPs数量最多,而其他种群的SNPs要少得多,因此通过比较
5、亚群间等位基因的频率将有助于阐明种族的结构和进化。在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在基因序列内,也有可能在基因以外的非编码序列上。总的来说,位于编码区内的SNP(codingSNP,cSNP)比较少,因为在外显子内,其变异率仅及周围序列的1/5.但它在遗传性疾病研究中却具有重要意义,因此cSNP的研究更受关注。从对生物的遗传性状的影响上来看,cSNP又可分为2种:一种是同义cSNP(synonymouscSNP),即SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同;另一种是非同义cSNP(non-synonymous
6、cSNP),指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能。这种改变常是导致生物性状改变的直接原因。cSNP中约有一半为非同义cSNP。先形成的SNP在人群中常有更高的频率,后形成的SNP所占的比率较低。各地各民族人群中特定SNP并非一定都存在,其所占比率也不尽相同,但大约有85%应是共通的。2.SNP自身的特性:1)SNP数量多,分布广泛。据估计,人类基因组中每1000个核苷酸就有一个SNP,人类30亿碱基中共有300万以上的SNPs.SNP遍布于整个人类基因组中,根据SNP在基因中的位置,可分为基因编码区SNPs(Coding-regionSNPs,cSN
7、Ps)、基因周边SNPs(PerigenicSNPs,pSNPs)以及基因间SNPs(IntergenicSNPs,iSNPs)等三类。2)SNP适于快速、规模化筛查。组成DNA的碱基虽然有4种,但SNP一般只有两种碱基组成,所以它是一种二态的标记,即二等位基因(biallelic)。由于SNP的二态性,非此即彼,在基因组筛选中SNPs往往只需+/-的分析,而不用分析片段的长度,这就利于发展自动化技术筛选或检