高通量测序技术及其应用

高通量测序技术及其应用

ID:1081276

大小:390.03 KB

页数:6页

时间:2017-11-07

上传者:U-2910
高通量测序技术及其应用_第1页
高通量测序技术及其应用_第2页
高通量测序技术及其应用_第3页
高通量测序技术及其应用_第4页
高通量测序技术及其应用_第5页
资源描述:

《高通量测序技术及其应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

中国生物工程杂志ChinaBiotechnology,2012,32(1):109114高通量测序技术及其应用1,23112王兴春杨致荣王敏李玮李生才(1山西农业大学生命科学学院太谷0308012山西农业大学农学院太谷030801)(3山西农业大学文理学院太谷030801)摘要高通量测序技术是DNA测序发展历程的一个里程碑,它为现代生命科学研究提供了前所未有的机遇。详细介绍了以454、Solexa和SOLiD为代表的第二代高通量测序技术,以HeliScopeTIRM和PacificBiosciencesSMRT为代表的单分子测序技术,以及最近LifeScience公司推出的IonPersonalGenomeMachine(PGM)测序技术等高通量测序技术的最新进展。在此基础上,阐述了高通量测序技术在基因组测序、转录组测序、基因表达调控、转录因子结合位点的检测以及甲基化等研究领域的应用。最后,讨论了高通量测序技术在成本和后续数据分析等方面存在的问题及其未来的发展前景。关键词高通量测序深度测序下一代测序基因组测序转录组测序中图分类号Q3作为最重要的分子生物学分析方法之一,DNA测命科学研究中的应用,以期使科研工作者尽早地了解序不仅为遗传信息的揭示和基因表达调控等基础生物该技术,并将其更好地应用到科研工作中。学研究提供重要数据,而且在基因诊断和基因治疗等1高通量测序技术及其发展现状应用研究中也发挥着重要的作用。随着科学的发展,传统的Sanger测序技术的局限性日益突出。一方面,高通量测序技术堪称测序技术发展历程的一个里该技术依赖于毛细管电泳,不但费时,而且测序反应数程碑,该技术可以对数百万个DNA分子进行同时测也受到限制(目前常用的ABI3730测序仪每次只能分序。这使得对一个物种的转录组和基因组进行细致全析96个样品);另一方面,该技术基于酶法测序,成本貌的分析成为可能,因此也称其为深度测序(deep较高。自2005年以来,以Roche公司的454技术、sequencing)[2]或下一代测序技术(nextgenerationIllumina公司的Solexa技术和ABI公司的SOLiD技术[3]sequencing,NGS)。目前,所说的高通量测序技术主为标志的高通量测序技术相继诞生。虽然高通量测序要是指454LifeSciences公司、ABI公司和Illumina公技术建立的时间不长,但发展非常快。已经应用于基TM司推出的第二代测序技术以及HelicosHeliscope和因组,包括测序和表观基因组学以及功能基因组学研PacificBiosciences推出的单分子测序技术。[1]究的许多方面。高通量测序技术已经将人们带到了1.1第二代测序技术真正的高通量测序时代,这些技术必将在生命科学领2005年,454LifeSciences公司(现已被Roche公司域得到广泛的应用,并产生极大的推动作用。然而,许收购)首先推出了革命性的基于焦磷酸测序法的超高多科研人员仅知道高通量测序技术的大概原理,而对通量基因组测序系统,开创了第二代测序技术的先河。于该技术在生命科学领域的应用却知之甚少。为此,该技术的原理是酶级联化学发光反应:首先将PCR扩本文详细阐述了高通量测序技术的最新进展及其在生增的单链DNA与引物杂交,并与DNA聚合酶、ATP硫收稿日期:20110411修回日期:20110602酸化酶、荧光素酶、三磷酸腺苷双磷酸酶、底物荧光素山西省青年科技研究基金(20100210301)、国家自然科学基金(31100235)资助项目酶和5′磷酸硫酸腺苷共同孵育。在每一轮测序反应中通讯作者,电子信箱:wxingchun@163.com;sxaulsc@126.com只加入一种dNTP,若该dNTP与模板配对,聚合酶就可 110中国生物工程杂志ChinaBiotechnologyVol.32No.12012以将其掺入到引物链中并释放出等摩尔数的焦磷酸。技术完全摒弃了上述测序平台所基于的PCR扩增的信焦磷酸盐被硫酸化酶转化为ATP,ATP就会促使氧合号放大过程,真正达到了读取单分子荧光的能力。具荧光素的合成并释放可见光。CCD检测后通过软件转体原理为:首先,将待测DNA样品随机打断成小片段,化为一个峰值,峰值与反应中掺入的核苷酸数目成正在每个小片段的末端加上polydA;然后,将小片段[4]比。此后,Illumina公司和ABI公司相继推出了DNA模板与固定在检测芯片上的polydT引物进行杂[5][6]Solexa和SOLiD(supportedoligoligationdetetion)测交并精确定位,并逐一加入荧光标记的末端终止子。序技术。它们与焦磷酸测序法的原理类似,核心思想在掺入了单个荧光标记的核苷酸后,洗涤、成像,之后都是边合成边测序(sequencingbysynthesis),即生成新切开荧光染料和抑制基团,洗涤、加帽,允许下一个核DNA互补链时,要么加入的dNTP通过酶促级联反应苷酸的掺入。这样通过掺入、检测和切除的反复循环,催化底物激发出荧光,要么直接加入被荧光标记的即可实时读取大量序列。随后,他们利用该技术对dNTP或半简并引物,在合成或连接生成互补链时释放M13基因组进行重测序。M13噬菌体是一种单链DNA出荧光信号。通过捕获光信号并转化为一个测序峰病毒,基因组全长6407个核苷酸。他们共获得了28值,获得互补链序列信息。由此可见第二代测序技术万条序列,开创了单分子高通量测序的先河。这之后无需进行电泳,操作极为简便。这不但大大节省了成不久,PacificBiosciences公司又开发出了另一种单分子本和时间,而且可以在芯片上进行高通量分析。该测测序技术———单分子实时技术(singlemoleculereal[8]序技术单次反应可以对数以百万计的样品进行分析,time,SMRT)。该技术利用单分子技术和DNA聚合这样庞大的测序能力是传统测序仪所不能比拟的。假酶,在聚合反应的同时就可以读取测序产物。SMRT测如利用这种方法进行人类基因组的测序,那么在数天序技术在测序速度、读长和成本方面有着巨大的优势内就可以完成,而且成本也将大大降低。和潜力。虽然目前的读取速度为3bp/s,但他们声称将Illumina公司目前拥有三种测序平台,分别为在2013年前实现三min测完人类基因组的目标。从而HiSeq2000、HiSeq1000、GenomeAnalyzerIIx(http://又向1000美元测定一个人类基因组的目标迈出了一www.illumina.com/);ABI公司则主要是SOLiD3和大步。SOLiD4两个测序平台。HiSeq2000测序平台单次反1.3IonPGM测序技术应可以读取200G的数据,而SOLiD4仅为100G左右。与Sanger双脱氧链终止法测序技术相比,上述测从通量这个最直观的数字看来,HiSeq2000领先于序技术在测序速度和成本方面都有了革命性的变革。SOLiD4。更高的通量就意味着更低的成本,利用但是,测序仪的价格非常昂贵。例如,目前HelicoHiSeq2000以30倍的覆盖度对两个人类基因组进行测BioScience公司的HeliScope测序仪售价近百万美元,序,每个基因组的费用不到1万美元(http://www.这是一般实验室和科研单位所不能承受的。2010年年illumina.com/systems/hiseq_2000.ilmn)。就测序读长底,LifeTechologies公司推出的IonPersonalGenomeTM来说,454测序平台读长最长,目前已经达到400nt。因Machine(PGM)测序仪价格仅为普通测序仪的1/此,454平台比较适合对未知基因组从头测序,但是在10,很好的解决了这一问题。IonPGM测序仪的设计是判断连续单碱基重复区时准确度不高。Solexa测序读基于半导体芯片技术,在半导体芯片的微孔中固定长较454短,仅为100nt左右,但测序通量高、价位低,DNA链,随后依次掺入ACGT。随着每个碱基的掺入,适合基因组重测序等。SOLiD读长也较短,但测序精度释放出氢离子,在它们穿过每个孔底部时能被检测到。较高,特别适合SNP检测等。与其它新一代测序仪相比,它不需要激光、照相机或标1.2单分子测序技术记,价格当然要便宜很多。这种独特的流体体系、微体在第二代测序平台不断完善和广泛应用的同时,系机械设计和半导体技术的组合,使得研究人员能够以对单分子DNA进行非PCR测序为主要特征的更新在2h内获取从10Mb到1Gb以上高精确度序列的测序技术也初显端倪。2008年4月,Helico(http://www.iontorrent.com/productsionpgm/)。[7]BioScience公司的Harris等在Science上报道了他们1.4高通量测序技术的优点开发的基于全内反射显微镜(totalInternalreflection高通量测序技术有三大优点是传统Sanger测序法microscopy,TIRM)的测序技术—单分子测序技术。该所不具备的。第一,它利用芯片进行测序,可以在数百 2012,32(1)王兴春等:高通量测序技术及其应用111万个点上同时阅读测序,把平行处理的思想用到极致,2.2高通量RNA测序及其在转录组和基因表达调控因此也称之为大规模平行测序(massivelyparallel研究中的应用signaturesequencing,MPSS),这一点是大家所熟知的。转录组研究是基因功能及结构研究的基础和出发第二,高通量测序技术有完美的定量功能,这是因为样点,是全基因组测序完成后首先要面对的问题。最近品中某种DNA被测序的次数反映了样品中这种DNA科学家们将高通量测序技术应用于转录组分析开发出的丰度。这一点有望取代以前的基因表达芯片技术用了RNA测序技术(RNASeq),该技术能够在全基因组于基因表达的研究。第三,成本低廉。利用传统Sanger范围内检测基因表达情况,进行差异基因筛选分析。测序法完成的人类基因组计划总计耗资27亿美元,虽由于RNASeq技术具有通量高、可重复性高、检测范围然比预计的30亿美元节省了不少,但仍是一个耗资巨宽、定量准等特点,已经广泛应用于细菌、拟南芥、水稻大的工程。而现在利用高通量测序技术进行人类基因和人类等生物转录组的研究。我国在应用RNASeq进[9]组测序,耗资不到传统测序法的1%。行水稻转录谱分析方面走在了世界的前列。王俊和韩斌领导的研究小组利用RNASeq技术分别对水稻的转2高通量测序技术的应用录组进行高分辨率的分析,发现水稻具有可变剪切模[1112]高通量测序技术的迅猛发展,将基因组学水平的式基因数目远远高于预期。研究带入了一个新的时期,也使经典分子生物科学家转录组研究是从整体水平研究基因功能以及基因对基因组学的认识和思考上升到一个新的水平。高通结构。但是,多数研究人员感兴趣的是某一特定的生量测序技术不仅可以进行大规模基因组测序,还可用物过程、发育阶段或处理后的基因表达情况。基因芯于基因表达分析、非编码小分子RNA的鉴定、转录因片技术曾在该领域的研究中发挥了重要的作用,但它子靶基因的筛选和DNA甲基化等相关研究。只能检测已知序列的特征,对于未知的序列无能为[13]2.1高通量测序技术在全基因组测序中的应用力。而建立在高通量测序基础上的数字化基因表达全基因组测序对全面了解一个物种的分子进化、谱(digitalgeneexpressionprofiling)分析无需预先针对基因组成和基因调控等有着非常重要的意义。但是,已知序列设计探针,即可对任何生物整体转录活动进[14]高通量测序技术在发展初期由于读长较短,使其在对行检测,因此应用范围更加广泛。最近,Eveland等未知基因组从头测序(denovoSequencing)的应用受到成功地将数字基因表达谱应用于玉米雌穗发育的研限制,只能用于基因组重测序。基因组重测序是指对究,并发现了一批调控花序结构的基因。已知基因组序列的物种进行不同个体的基因组测序,高通量RNA测序技术另一个广泛应用的领域是并在此基础上对个体或群体进行差异性分析。2008年小RNA的研究。小RNA在植物的生长、发育和外界胁4月17日的Nature杂志上,美国的科学家发表了首个迫应答等方面具有重要功能。但由于小RNA序列短、利用新一代高通量测序技术得到的人类全基因组,这同源性高,因此利用基因芯片检测小RNA非常困难。个基因组正是“DNA之父”JamesD.Watson的[9]。整高通量测序技术不但能够克服这一难题,而且能够发个测序过程在2个月内就完成了,花费不到100万现新的小RNA。目前,高通量测序技术已经成功的应[15][16][17]美元。用于拟南芥、水稻和小麦等生物小RNA的随着高通量测序技术的不断完善,独立应用该技研究。术进行全基因组从头测序成为可能。2010年1月212.3ChIPSeq技术及其在DNA和蛋白质相互作用日,由深圳华大基因研究院发起,中国科学院昆明动物研究中的应用研究所、中国科学院动物研究所、成都大熊猫繁育研究染色质免疫共沉淀(chromatinimmunoprecipitation,基地和中国保护大熊猫研究中心参与的大熊猫基因组ChIP)技术是研究体内蛋白质与DNA之间相互作用的测序成果以封面文章的形式发表在国际权威杂志强有力工具,在转录因子结合位点或组蛋白特异性修[18]Nature上[10]。这是全球第一个完全使用高通量测序技饰位点的研究中被广泛应用。最近诞生的染色质免疫共沉淀测序(chromatinimmunoprecipitation术完成的基因组序列图。sequencing,ChIPSeq)技术充分结合了ChIP和高通量测序技术的优势,能够在全基因组范围内高效地研究 112中国生物工程杂志ChinaBiotechnologyVol.32No.12012[29]目的蛋白的结合位点。该技术的原理是:首先通过序数据的分析却成为一大难题。第二,高通量测序ChIP技术利用抗体特异性地富集交联的目的蛋白技术不适合小规模测序。虽然高通量测序技术的价格DNA复合体;然后再将得到的DNA片段进行高通量测不断降低,但一次反应仍需几千至数万元的花费。这序;最后将获得的数百万条序列标签精确定位到基因对于PCR产物和质粒等数十到数千个碱基的测序,一组上,从而获得全基因组范围内与组蛋白或转录因子般客户将是很难接受的,这时传统Sanger测序法无疑等互作的DNA区段信息。该方法克服了以往染色质还是最佳的选择。最后,新一代测序仪价格昂贵,动辄免疫共沉淀芯片(chromatinimmunoprecipitationchip,几百万元,一般的小型实验室难以承受。因此,传统ChIPchip)技术依赖于实验者选择探针的不足,可以为Sanger将与高通量测序技术长期并存,在短期内还不会[19][30]任何生物测序。2007年,应用ChIPSeq技术获得研被淘汰。另外,高通量测序技术只是研究的开端,现[20][21][22]究成果分别发表在Science、Nature和Cell三大在我们所能解释的生物学现象和机制还很有限,即使顶级刊物上。我们在体细胞胚胎发生的研究中发现了获得了基因组信息,如何去解释和应用它,仍是一个长一个PGA37基因,该基因编码一个R2R3MYB转录因远的问题。子,在植物体细胞胚胎发生和脂肪酸生物合成过程中测序技术的发展日新月异,本文所述的焦磷酸测[23]起着重要的调控作用。分离并鉴定PGA37的靶基序等测序平台都依赖生物化学反应。这不但加大了测因是阐明该基因生物学功能的关键。为此,我们正与序成本,而且浪费了时间,不利于测序速度的提升。因有关测序公司洽谈,利用ChIPSeq技术来筛选PGA37此,非光学显微镜成像、纳米孔和生物孔等直接测序技的靶基因。[30]术是未来的发展方向。相信随着高通量测序成本的2.4高通量测序技术在基因组DNA甲基化分析中的进一步降低和对海量数据处理能力的不断提高,高通应用量测序将成为一项常规的实验手段,并为生物学和生DNA甲基化在维持细胞正常功能、遗传印记和胚物医学研究领域带来革命性的变革。胎发育过程中起着极其重要的作用。新一代高通量测参考文献序技术使得基因组整体水平高精度的甲基化检测成为现实。目前,已经建立了至少三种依赖于高通量测序[1]MardisER.NextgenerationDNAsequencingmethods.Annu的DNA甲基化分析技术:甲基化DNA免疫共沉淀测序RevGenomicsHumGenet,2008,9:387402.(methylatedDNAimmunoprecipitationsequencing,[2]SultanM,SchulzMH,RichardH,etal.Aglobalviewofgene[24]activityandalternativesplicingbydeepsequencingofthehumanMeDIPSeq)、甲基结合蛋白测序(methylbindingtranscriptome.Science,2008,321(5891):956960.proteinsequencing,MBDSeq)和亚硫酸氢盐测序[3]SchusterSC.Nextgenerationsequencingtransformstoday’s[25](bisulfitesequencing,BSSeq)。它们之间的区别在biology.NatMethods,2008,5(1):1618.于前两种方法首先通过特异性结合甲基化DNA的[4]MarguliesM,EgholmM,AltmanWE,etal.GenomeMBD2b或5′甲基胞嘧啶抗体富集高甲基化的DNA,然sequencinginmicrofabricatedhighdensitypicolitrereactors.后再对富集到的片段测序,而第三种方法不经过富集Nature,2005,437(7057):376380.直接测序。虽然MeDIPSeq和MBDSeq都是基于富[5]PorrecaGJ,ZhangK,LiJB,etal.Multiplexamplificationof集的原理,但二者是相辅相成的策略。MeDIPSeq对高largesetsofhumanexons.NatMethods,2007,4(11):931度甲基化和高密度的CpG更加敏感,而MDBSeq对高936.度甲基化和中等CpG密度更加敏感[26]。目前,高通量[6]OndovBD,VaradarajanA,PassalacquaKD,etal.Efficient[25][27][28]mappingofAppliedBiosystemsSOLiDsequencedatatoa测序技术已经广泛应用于拟南芥、水稻、蚕和[26]referencegenomeforfunctionalgenomicapplications.人等生物DNA甲基化的研究,并取得了丰硕的Bioinformatics,2008,24(23):27762777.成果。[7]HarrisTD,BuzbyPR,BabcockH,etal.SinglemoleculeDNA3高通量测序技术存在的问题及其发展趋势sequencingofaviralgenome.Science,2008,320(5872):106109.尽管高通量测序技术有诸多的优势,但其局限性[8]EidJ,FehrA,GrayJ,etal.RealtimeDNAsequencingfrom也不容忽视。第一,测序速度提高了,但后续的海量测singlepolymerasemolecules.Science,2009,323(5910):133 2012,32(1)王兴春等:高通量测序技术及其应用113138.[20]JohnsonDS,MortazaviA,MyersRM,etal.Genomewide[9]WheelerDA,SrinivasanM,EgholmM,etal.ThecompletemappingofinvivoproteinDNAinteractions.Science,2007,316genomeofanindividualbymassivelyparallelDNAsequencing.(5830):14971502.Nature,2008,452(7189):872876.[21]MikkelsenTS,KuM,JaffeDB,etal.Genomewidemapsof[10]LiR,FanW,TianG,etal.Thesequenceanddenovoassemblychromatinstateinpluripotentandlineagecommittedcells.ofthegiantpandagenome.Nature,2010,463(7279):311317.Nature,2007,448(7153):553560.[11]LuTT,LuGJ,FanDL,etal.Functionannotationoftherice[22]BarskiA,CuddapahS,CuiK,etal.HighresolutionprofilingoftranscriptomeatsinglenucleotideresolutionbyRNAseq.histonemethylationsinthehumangenome.Cell,2007,129GenomeRes,2010,20(9):12381249.(4):823837.[12]ZhangGJ,GuoGW,HuXD,etal.DeepRNAsequencingat[23]WangX,NiuQW,TengC,etal.OverexpressionofPGA37/singlebasepairresolutionrevealshighcomplexityofthericeMYB118andMYB115promotesvegetativetoembryonictranscriptome.GenomeRes,2010,20(5):646654.transitioninArabidopsis.CellRes,2009,19(2):224235.[13]滕晓坤,肖华胜.基因芯片与高通量DNA测序技术前景分[24]DownTA,RakyanVK,TurnerDJ,etal.ABayesian析.中国科学C辑:生命科学,2008,38(10):891899.deconvolutionstrategyforimmunoprecipitationbasedDNATengXK,XiaoHS.PerspectivesofDNAmicroarryandnextmethylomeanalysis.NatBiotechnol,2008,26(7):779785.generationDNAsequencingtechnologies.ScienceinChinaSeries[25]CokusSJ,FengS,ZhangX,etal.ShotgunbisulphiteCLifeScience,2008,38(10):891899.sequencingoftheArabidopsisgenomerevealsDNAmethylation[14]EvelandAL,SatohNagasawaN,GoldshmidtA,etal.Digitalpatterning.Nature,2008,452(7184):215219.geneexpressionsignaturesformaizedevelopment.PlantPhysiol,[26]LiN,YeM,LiY,etal.WholegenomeDNAmethylation2010,154(3):10241039.analysisbasedonhighthroughputsequencingtechnology.[15]LuC,TejSS,LuoS,etal.ElucidationofthesmallRNAMethods,2010,52(3):203212.componentofthetranscriptome.Science,2005,309(5740):[27]YanHH,KikuchiS,NeumannP,etal.Genomewidemapping15671569.ofcytosinemethylationrevealeddynamicDNAmethylation[16]SunkarR,ZhouX,ZhengY,etal.Identificationofnovelandpatternsassociatedwithgenesandcentromeresinrice.PlantJ,candidatemiRNAsinricebyhighthroughputsequencing.BMC2010,63(3):353365.PlantBiol,2008,8:2541.[28]XiangH,ZhuJ,ChenQ,etal.Singlebaseresolution[17]YaoY,GuoG,NiZ,etal.Cloningandcharacterizationofmethylomeofthesilkwormrevealsasparseepigenomicmap.NatmicroRNAsfromwheat(TriticumaestivumL.).GenomeBiol,Biotechnol,2010,28(5):516520.2007,8(6):96108.[29]GiladY,PritchardJK,ThorntonK.Characterizingnatural[18]SolomonMJ,LarsenPL,VarshavskyA.MappingproteinDNAvariationusingnextgenerationsequencingtechnologies.Trendsinteractionsinvivowithformaldehyde:evidencethathistoneH4isinGenetics,2009,25(10):463471.retainedonahighlytranscribedgene.Cell,1988,53(6):937[30]ZhouX,RenL,LiYetal.Thenextgenerationsequencing947.technology:atechnologyreviewandfutureperspective.SciChina[19]ParkPJ.ChIPseq:advantagesandchallengesofamaturingLifeSci,2010,53(1):4457technology.NatRevGenet,2009,10(10):669680.HighthroughputSequencingTechnologyandItsApplication1,23112WANGXingchunYANGZhirongWANGMinLIWeiLIShengcai(1CollegeofLifeSciences,ShanxiAgriculturalUniversity,Taigu030801,China)(2CollegeofAgriculture,ShanxiAgriculturalUniversity,Taigu030801,China)(3CollegeofArtsandSciences,ShanxiAgriculturalUniversity,Taigu030801,China)AbstractAsamilestoneinthedevelopmentofDNAsequencing,highthroughputsequencingtechnology 114中国生物工程杂志ChinaBiotechnologyVol.32No.12012providesanunprecedentedopportunityforthemodernlifesciences.Therecentprogressonthistechnology,includingthesecondgenerationsequencingtechnology(representedby454,SolexaandSOLiD),thethirdgenerationsequencingtechnology(representedbyHeliScopeTIRMandPacificBiosciencesSMART)andtheIonPersonalGenomeMachinesequencingtechnologyaresummarized.Then,theapplicationofthehighthroughputsequencingtechnologyingenomesequencing,transcriptomesequencing,geneexpressionregulation,detectionofbindinglocationsfortranscriptionfactorsandmethylationanalysisaresummarized.Finally,thedisadvantagesandtheprospectsofthistechnologywerediscussed.KeywordsHighthroughputsequencingDeepsequencingNextgenerationsequencingGenomeSequenceTranscriptomesequence

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭