欢迎来到天天文库
浏览记录
ID:17934467
大小:2.29 MB
页数:41页
时间:2018-09-11
《基因注释与功能分类》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第八章基因注释与功能分类GeneAnnotationAndFunctionalClassification哈尔滨医科大学李霞第一节引言背景随着后基因组(post-genomics)时代的来临,基因组学的研究重心开始从阐明所有遗传信息转移到在整体分子水平对功能进行研究。这种转变的一个重要标志是产生了功能基因组学(functionalgenomics)。任务功能基因组学的主要任务之一是进行基因组功能注释(genomeannotation),了解基因的功能,认识基因与疾病的关系,掌握基因的产物及其在生命活动中的作用等。意义快速有效的基因注释对进一步识别基因,研究基因的表达调控机制,研究基因在生
2、物体代谢途径中的地位,分析基因、基因产物之间的相互作用关系,预测和发现蛋白质功能,揭示生命的起源和进化等具有重要的意义。第二节基因注释数据库GeneAnnotationDatabase一、研究人员已经掌握了大量的全基因组数据,同时关于基因、基因产物以及生物学通路的数据也越来越多,解释生物学实验的结果,尤其从基因组角度,需要系统的方法。基因注释数据库产生的原因二、在基因组范围内描述蛋白质功能十分复杂,最好的工具就是计算机程序,提供结构化的标准的生物学模型,以便计算机程序进行分析,成为从整体水平系统研究基因及其产物的一项基本需求。一、基因本体(geneontology,GO)数据库基因本体数
3、据库是GO组织(GeneOntologyConsortium)在2000年构建的一个结构化的标准生物学模型,旨在建立基因及其产物知识的标准词汇体系,涵盖了基因的细胞组分(cellularcomponent)、分子功能(molecularfunction)、生物学过程(biologicalprocess)。GO数据库最初收录的基因信息来源于3个模式生物数据库:果蝇、酵母和小鼠,随后相继收录了更多数据,其中包括国际上主要的植物,动物和微生物基因组数据库。GO术语在多个合作数据库中的统一使用,促进了各类数据库对基因描述的一致性。GO数据库收录的基因组数据列表GO注释体系特点GO通过控制注释词汇
4、的层次结构使得研究人员能够从不同层面查询和使用基因注释信息。从整体上来看GO注释系统是一个有向无环图(DirectedAcyclicGraphs),包含三个分支,即:生物学过程(biologicalprocess),分子功能(molecularfunction)和细胞组分(cellularcomponent)。注释系统中每一个结点(node)都是基因或蛋白的一种描述,结点之间保持严格的关系,即“isa”或“partof”。1.用关键词检索GO数据库检索GO数据库通常先进入AmiGO的首页。在GO数据库中,每条记录都有一个数据标识号GO:XXXXXX和对应的术语。因此检索时需要知道待查基因
5、的数字标识号或术语,将它们直接输入框中检索即可。如果检索的基因或蛋白质存在别名,可在检索框下勾选“geneorproteins”,并在检索框中输入别名检索;“exactmatch”表示是否完全匹配,可供选择。一、使用GO数据库这里以检索神经源性分化因子6(NEUROD6)为例。在检索框中输入“NEUROD6”并勾选“geneandproteins”和“exactmatch”,运行后所得基因产物检索结果如图所示。举例人民卫生出版社8年制及7年制临床医学等专业用《生物信息学》此图显示了该基因产物的基本信息,包括类型、物种、别名来源和序列此图显示了该基因产物的术语关联(termassociat
6、ions)图,图中记录名称“Term”是GO记录的名字,“Ontology”是该基因产物的特性,如要查看其分子功能,可点击其中的一条记录“nervoussystemdevelopment”。此图上部先对神经源性分化因子6的相关信息做简单描述,中间术语系谱(termlineage)成阶梯状分布,记录了GO数据库中全部分子功能所处的位置和关系。下方“ExternalReference”提供了与外部相关数据的链接。点击上图右上方的可视化视图(graphicalview)就更清晰地显示了分子功能记录之间构成的复杂网状结构,既有上下隶属关系,也存在平行关系。2.用序列检索GO数据库对于未知基因名的
7、序列,可以用序列直接检索GO数据库。点击AmiGO首页上方的“BLAST”。界面风格类似于其他数据库BLAST搜索的网页,在检索框中铁如氨基酸或核酸序列,网页能自动识别并相应地做BLASTP或BLASTX和数据库中的序列比对。这里以检索RPIA基因的序列为例,如图所示。1.简介京都基因与基因组百科全书(Kyotoencyclopediaofgenesandgenomes,KEGG)是系统分析基因功能、基因组信息的数据库,它整合了基因
此文档下载收益归作者所有