欢迎来到天天文库
浏览记录
ID:56882254
大小:319.79 KB
页数:15页
时间:2020-07-19
《细菌地基因预测以及注释.docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、Whole-genomeAnnotationofanA.baumanniistrainA.baumanniiACICU摘要随着新一代测序技术的发展,微生物全基因组测序的成本大大减少,DNA序列的生成速度已远远超过其基因的注释速度。功能基因组学的研究已经成为当今研究的主流。然而如此多的数据对现有的基因注释工具提出了巨大的挑战。本研究通过对A.baumaniiACICU染色体序列使用GeneMarks进行基因预测,预测到了3718个基因,然后使用RAST进行基因注释,共注释到了3683个功能基因,将得
2、到的结果与原文献中所注释到的基因进行对比。最后得到结论,基因的预测与注释都需要综合不同软件的结果进行分析,才能得到较为准确的结果。本研究为原核生物全基因组的注释提方法供了参考。关键字:基因注释全基因组鲍曼不动杆菌GeneMarksRAST目录1.引言(Introduction)31.1.背景介绍31.2.全基因组注释软件31.3.A.baumanniiACICU相关42.材料与方法(MethodsandMaterials)52.1.使用GeneMarks进行ORF预测52.2.使用RAST进行功能
3、基因注释63.结果与讨论(ResultsandDiscussion)83.1.使用GeneMarks预测ORF的结果以及分析83.2.使用RAST进行功能基因注释结果以及分析93.3.综合分析10参考文献101.引言(Introduction)1.1.背景介绍一个完整的基因组是指组成一个生物体全部DNA的集合。想要完全了解一个生命体,首先需要知道它的全基因组序列,因为生命体本身的遗传信息是不会轻易改变的。基因组研究包括两方面容:(1)以全基因组测序为目标的结构基因组学(2)以基因功能鉴定为目标的功
4、能基因组学,也叫后基因组(postgenome)研究。其中结构基因组学的重点就是利用高通量测序仪进行全基因组测序。随着测序的完成,功能基因组学研究成为研究的主流。功能基因组学的研究容很多,主要包括:基因组表达调控的研究、基因信息的识别和鉴定、基因功能信息的提取和鉴定、基因多样性分析、比较基因组学等。随着新一代测序技术的发展,微生物全基因组测序的成本大大减少,DNA序列的生成速度已远远超过其基因的注释速度。现阶段超过300个细菌基因组序列已可以在公开数据库中查询,同时有更多的微生物基因组序列测序工作
5、即将完成并在近期发布。如何利用这些原始序列信息来更好的了解微生物中诸如基因的识别和注释、蛋白质的结构和功能等生物学知识,这是我们现阶段要做的重要工作。传统上,人们用实验方法验证基因组中的蛋白质编码基因,但这种方法费时费力,且带有较大的盲目性。因此,基因组注释不可避免要依靠自动化注释软件,采用自动化注释对生物序列特别是大规模的基因组序列进行分析和注释,从而对传统生物学实验产生有益的方向性指引是当前研究的热点。然而,自动化注释必然会引进和传播一些错误的注释信息,其结果往往需要人工修正,数据库中收录的已
6、测序和注释的基因序列数量巨大,手工修正所有的注释序列也是不可行的[1]。基因组注释的准确性已变得越来越为重要,新的注释方法不断研发,如根据序列组成特征或核苷酸出现频率模式等多种参数对蛋白质编码基因起始位点、假蛋白基因和RBS位点的的识别方法。这些研究加上不断完善的数据库信息和新的实验验证知识,在不久的将来无疑会对基因组注释的准确度起到更好的作用。1.1.全基因组注释软件目前,针对基因组学研究的各个方向都有许多现成的软件。这些软件都是研究者或商业公司针对某些分析方法开发的,为后来研究者提供了巨大的便
7、捷。基因组注释是在得到全基因组序列后首先要做的。它是利用生物信息学方法,对基因组所有基因的生物学功能进行功能注释,包括基因预测和基因功能注释两个方面。目前已经有许多的基因预测工具或者在线注释。基因预测的方法主要有3种:(1)分析mRNA和EST数据直接得到结果;(2)通过相似性比对从已知基因和蛋白质序列得到间接证据;(3)基于各种统计模型和算法从头预测,比如隐马可夫模型。其过相似性比对得到预测基因的方法最常见。例如,现在流行的做法是先通过Glimmer、GeneMarks等软件预测出基因组的ORF
8、。然后通过Blast方法将ORF同其他物种的基因进行比对。有同源基因的ORF被注释为同样功能的基因,没有同源性的ORF被舍去或注释为假说蛋白(hypotheticalprotein)。由于注释需要大量的数据库,为了使注释变得简单,一些研究机构将不同功能的注释软件整合在一起,提供在线的注释服务。如RAST[2]、Xbase等,NCBI的PGAAP能提供人工的注释服务。这些只需要用户将序列和序列的所属物种分类信息提交即可。注释好的结果为gbk格式文件(包含序列和注释信息)[3]。Gen
此文档下载收益归作者所有