欢迎来到天天文库
浏览记录
ID:32567278
大小:67.80 KB
页数:2页
时间:2019-02-12
《浅谈细菌基因组的finish》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、浅谈细菌基因组的finish随着我国承担的1%人类基因组计划的完成,我国基因组科学取得了长足发展,特别是以中科院基因组研究所为代表的科研院所和以华大为代表的企业像雨后春笋一样,不断发展壮大。近年来,我国先后完成了人类基因组1%计划、水稻基因组计划、炎黄计划、大熊猫基因组计划等重大项目。这为我国基因组学的发展带来了空前的机遇,也使我国科学家在基因组学方面积累了丰富的知识。454、solexa和solid等第二代测序仪的出现,使得基因组测序成本大大下降,这也使某个实验室或者课题组独立完成一个物种的基因组特别是像细菌这样的小基因组成为可能。这也为我国科学家在测序技术方面提供了强有力的支持和
2、保证。在这种背景下,为了更好的研究某一物种,对这一物种进行基因组测序往往成为我国科学家们的共识。但是,如何将海量的测序结果组装成一条完整的染色体就成了基因组测序工作中的重中之重,也是制约基因组测序工作的瓶颈问题。有幸的是,目前我参加了中科院北京基因组研究所的一个细菌基因组合作项目,在这个项目中,我走了很多弯路,也遇到了很多问题,下面我想就我在这个细菌基因组项目finish阶段从北京基因组研究所学到的一些经验给大家介绍一下,希望能对大家能有所帮助。下面我将按照我认为最合适的细菌基因组finish步骤给大家逐一介绍。首先是测序。在这一阶段,我们要注意的就是细菌基因组DNA的提取:第一要避
3、免污染,第二要做好纯化。这一步做好了,对我们后期的基因组finnish有事半功倍的效果。第二步是组装。现在可用来组装的程序很多,如果你对这些程序不是很了解,推荐你用测序仪自带的组装程序,比如454测序仪用Newbler程序。我们也可以用phred、phrap、consed程序包,但是通过我的比较,phred、phrap、consed程序包不如Newber程序,但是后期的gapfinish我推荐用phred、phrap、consed程序包。第三步是finish,这也是今天要介绍的重点。Finish阶段是最繁琐,也是最耗时的阶段。在这阶段,如果你是第一次做基因组finish,我推荐你至少
4、要看看基因组方面的文章,对自己这个基因组要finish到什么程度有个了解,其次,和有经验的人多聊聊,他们遇到的问题,一定是你也要遇到的问题,然而,他们多走的弯路,你可以通过询问少走一点。下面就是具体操作:第一,我们需要登陆NCBI官方网站,下载这个基因组的所有数据,包括已知的基因组(如果有就是重测序,没有就是denovo,即第一次测序)、质粒、基因、RNA、蛋白质、EST等。如果有近缘物种或株系的基因组数据,我们也要下载下来。第二,就是你要对自己的组装结果有个大致的了解:知道组装好的每个contig的长度、reads数和reads的base数,总contig的长度、reads数和re
5、ads的base数。这样,你就可以计算出这个基因组所有contig的平均coverage和每个contig的coverage。通过每个contig的coverage与平均coverage的比值,我们可以知道这些contig那些在基因组上是unique的,那些是重复序列,重复序列的coverage大概是平均coverage的多少倍,即大概在基因组上出现了多少次。第三,如果有近缘物种或株系的基因组,那么用我们组装的所有contig和近缘基因组进行序列比较(如blast),将所有contig定位到近缘基因组上,从而帮助确定contig之间的关系(精确到contig的哪一端和哪一端连接)。如
6、果没有近缘物种,那么用我们组装的所有contig和NCBI的nr/nt库进行序列比较,用那些能和两个或两个以上的contig比对上的序列来定位contig之间的关系。此外,我们还要提取能和contig比对上的那些序列的信息,这可以帮助我们了解我们的contig是什么序列,如rRNA、转座子、重复序列等,也可以帮助我们去除DNA污染,将那些和其他物种基因组完全比对上的contig作为DNA污染去除。如果这些都没能帮助我们很好的定位contig之间的关系,那么我们就只能通过第四步来确立contig之间的关系了。第四,根据那些能在两个或者两个以上contig中出现的reads,提取cont
7、ig之间可能的连接关系。第五,这也也是最关键的一步,就是补洞。我们只对那些长度大于500bp或者1kb的contig进行后继分析,因为小于500bp或者1kb的contig在我们后期测序过程中通常可以跨过去。首先,我们要对这些contig进行归类,分为uniquecontig和重复contig。对那些uniquecontig,我们需要在每个contig的两端大概300bp左右设计并合成向外的PCR引物。合成引物时,我们可以将contig默认的起始部位认为是
此文档下载收益归作者所有