欢迎来到天天文库
浏览记录
ID:43589619
大小:50.00 KB
页数:6页
时间:2019-10-11
《测序数据分析之专家指南》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、测序数据分析之专家指南转载白生物通Sep.2011测序确实是越來越快,也越來越便宜了。随着个人型测序仪的不断上市,许多实验室也跃跃欲试,准备开展这方面的研究。然而,前辈告诉我们,测序并不难,真正闲难的工作是数据分析。冃前有不少用于基因组装配和比对的程序和算法,但是该选哪一个呢?许多序列分析的专家认为,这取决于基因组的大小、读取有多长,以及采用的是哪种测序技术。通常,软件还需要优化,以满足每个实验室的独特需求。为了让人家更好地开展数据分析,《GenomeTechnology))杂志特邀了一些这方面的
2、专家,与大家分亨他们在数据分析方面的经验。通过他们的一问一答,希望您也能从中受益。Q1:您使用哪个基因组装配或比对软件,为什么?InnaDubchak(美国能源部联合基因组研究所)我们设计了一个名为VISTA的计算系统,它融合了长基因组序列的不同比对算法。不同项目需要不同的算法,如AVID适合楮确序列或序列草图的整体两两比对,LAGAN适合精确序列的整体两两比对或多个比对,而Shuffle-LAGAN适合精确序列的glocal两两比对,因为它检测重排。JimKcnt(加州大学圣克鲁兹分校)我们白己
3、比较少做基因组装配。我们主要是从装配好的基【天1组开始的。关于比对,我们使用BLAT进行一个物种内的RNA/DNA比对及其他比对,使用blastz和lastz进行物种之间的两两比对,并用axtChain和chain-Net进一步处理。关于多个比对,我们正在用multiz,但也在试一些新软件。IanKorf(加州大学戴维斯分校)因为我们运行Assemblathon竞争,所以我们运行多个装配和比对程序。每一个都冇自己的优势和劣势。事实上,我们也不知道哪个更好。冇时候有的程序更方便。Li-junMa(马
4、萨诸塞大学)我所做的大部分基因组装配都是利用Arachne或AllPath完成的,它们是由Broad开发的。选择这些装配工具的主要原因是,它们是由Broad研究院的软件工程师经过多年艰苦工作而开发的。它们是可靠的工具。它们已经通过很多基因组的多个数据组形式检验过,这些基因组大小不同,性质各异。它们很复杂,但非常可靠。现在,我们也使用Velvet来装配Illumina的数据组。它使用简单,运行快。BudMishra(纽约大学)我们是一个生物信息学小组,致力于开发新的装配、碱基检出和比对工具。我们的冃
5、标是让这些工具以一种与技术无关的方式共同工作,得到准确的结果,以便更好地进行全基因组关联研究(GWAS)o基于这些冃的,我们主要关注一种碱基检出工具TotalReCaller和一种装配工具SUTTA。为了比较,我们也与其他序列装配和比对工具共同使用:SOAPdenovo>Abyss>CABOG>Vclvet>TIGRArachne等开放匸具以及Illumina开发的BustradIbis>Rolexa、BayesCall等。根据我们的经验,对于高覆盖度的Illumina序列,口J从Illumina
6、的Bustrad碱基检出开始,然后用SOAPdenovo或Allpaths来装配读取,之后可能还要确认。今后,一种更加一体化的方法将把Illumina的序列和光学图谱与TotalReCaller和SUTTA结合起來,得到基因型或单体型序列。MihaiPop(马里兰人学)这个问题町没什么标准答案。它取决于实际的应用。对于短读取的快速严格比对,我使用Bowtieo对于没那么严格的长读取,我使用MUMmero这个选择主要是基于习惯和对这些工具的熟悉程度。对于装配,我也依靠多个工具,同样取决于实际应用。对
7、于Sanger或454读取,我使用CeleraAssembler,而Ncwblcr对于454数据也非常好,而短序列我会使用SOAPdenovo或Velveto我通常对那些unitigging使用这些装配工具,生成相对保守的contigo然后,我使用自己的工具Bambus,掺入mate・pair信息或其他相关信息。我使用Bambus是因为我能更好控制装配T具实际产生的。大部分现代装配工具只生成一个FASTA文件,抛弃了读取在哪里比对的信息。在很多应用(如宏基因组学)中,这个信息才是真正有用的。Ste
8、venSalzberg(约翰霍普金斯大学医学院)我们使用6个主耍的基因组装配工具包:CABOG(Z前称为CeleraAssembler)sSOAPdenovo>theAMOSpackage、Allpaths-LG>Velvet,以及我们最近开始用的SGAo对于比对,我只能冋答新一代DNA序列读取与参考基因组的比对,我使用Bowtie(我们小组开发的)。如果读取代表了RNA-Scq实验中的RNA,我们使用TopHat来比对,并用Cufflinks来装配和定量转录本。RobertSet
此文档下载收益归作者所有