欢迎来到天天文库
浏览记录
ID:55952365
大小:477.90 KB
页数:8页
时间:2020-06-18
《Gene Ontology(GO)简介与使用介绍.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、GeneOntology(GO)简介与使用介绍1.GO怎么就出现了?现今的生物学家们浪费了太多的时间和精力在搜寻生物信息上。这种情况归结为生物学上定义混乱的原因:不光是精确的计算机难以搜寻到这些随时间和人为多重因素而随机改变的定义,即使是完全由人手动处理也无法完成。举个例子来说,如果需要找到一个用于制抗生素的药物靶点,你可能想找到所有的和细菌蛋白质合成相关的基因产物,特别是那些和人中蛋白质合成组分显著不同的。但如果一个数据库描述这些基因产物为“翻译类”,而另一个描述其为“蛋白质合成类”,那么这无疑对于计算机来说是难以区分这两个在字面上相差甚远却在功能上相一致的定义。Gen
2、eOntology(GO)项目正是为了能够使对各种数据库中基因产物功能描述相一致的努力结果。这个项目最初是由1988年对三个模式生物数据库的整合开始::FlyBase(果蝇数据库Drosophila),tSaccharomycesGenomeDatabase(酵母基因组数据库SGD)andtheMouseGenomeDatabase(小鼠基因组数据库MGD)。从那开始,GO不断发展扩大,现在已包含数十个动物、植物、微生物的数据库。GO的定义法则已经在多个合作的数据库中使用,这使在这些数据库中的查询具有极高的一致性。这种定义语言具有多重结构,因此在各种程度上都能进行查询。举
3、例来说,GO可以被用来在小鼠基因组中查询和信号转导相关的基因产物,也可以进一步找到各种生物地受体酪氨酸激酶。这种结构允许在各种水平添加对此基因产物特性的认识。2.GO的发展和组织形式GO发展了具有三级结构的标准语言(ontologies),根据基因产物的相关分子功能,生物学途径,细胞学组件而给予定义,无物种相关性。三种本体论的内容如下:1)分子功能本体论基因产物个体的功能,如与碳水化合物结合或ATP水解酶活性等2)生物学途径本体论分子功能的有序组合,达成更广的生物功能,如有丝分裂或嘌呤代谢等3)细胞组件本体论亚细胞结构、位置和大分子复合物,如核仁、端粒和识别起始的复合物等
4、基本来说,GO工作可分为三个不同的部分:第一,给予和维持定义;第二,将位于不同数据库中的本体论语言、基因和基因产物进行联系,形成网络;第三,发展相关工具,使本体论的标准语言的产生和维持更为便捷。3.GO的形式GO定义的术语有着直接非循环式(directedacyclicgraphs(DAGs)的特点,而并非是传统的等级制定义方式(随着代数增加,下一级比上一级更为具体)。举个例子来说,生物学途径中有一个定义是己糖合成,它的上一级为己糖代谢和单糖合成。当某个基因被注解为“己糖合成活性”后,它自动地获得了己糖代谢和单糖合成地注解。因为在GO中,每个术语必须遵循“真途径“法则,即
5、如果下一代的术语可以用于描述此基因产物,其上一代术语也可以适用。4.GO的注释(Annotation)那么,GO中的术语如何和相对应的基因产物相联系的呢?这是由参与合作的数据库来完成的,它们使用GO的定义方法,对它们所包含的基因产物进行注解,并且提供支持这种注解的参考和证据。每个基因或基因产物都会有一个列表,列出与之相关的GO术语。每个数据库都会给出这些基因产物和GO术语的联系数据库,并且也可以在GO的ftp站点上和WEB方式查询到。而且,GO联合会提供了简化的本体论术语(GOslim),这样,可以在更高级的层面上研究基因组的功能。比如,粗略地估计哪一部分的基因组与信号传
6、导、代谢合成或复制有关。GO对基因和蛋白的注释阐明了基因产物和用于定义他们的GO术语之间的关系。基因产物指一个基因编码的RNA或蛋白产物。因为一个基因可能编码多个具有很不相同性质的产物,所以GO推荐的注释是针对基因产物的而不是基因的。一个基因是和所有适用于它的术语联系在一起的。一个基因产物可以被一种本体论定义的多种分支或多种水平注释。注释需要反映在正常情况下此基因产物的功能,生物途径,定位等,而并不包括其在突变或病理状态下的情况。GO联合会的各个数据库成员采用手动或自动的方式生成注释,这两种方式共有的原理是:一.所有的注释都需要有来源,可以是文字、另一个数据库或是计算机分
7、析结果;二.注释必须提供支持这种基因产物和GO术语之间联系的证据。5.GO文件格式GO的所有数据都是免费获得的。GO数据有三种格式:flat(每日更新)、XML(每月更新)和MySQL(每月更新)。这些数据格式都可以在GOftp的站点上下载。XML和MySQL文件是被储存于独立的GO数据库中。如果需要找到与某一个GO术语相关的基因或基因产物,可以找到一个相应表格,搜寻到这种注解的编号,并且可以链接到与之对应的位于不同数据库的基因相关文件。6.GO浏览器和修改器(browserandeditor)GO术语和注释使用了多种不同的工
此文档下载收益归作者所有