欢迎来到天天文库
浏览记录
ID:39849737
大小:348.32 KB
页数:15页
时间:2019-07-13
《生物信息学第六章核酸序列分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第六章核酸序列分析DNA序列自身编码特征的分析是基因组信息学研究的基础,特别是随着大规模测序的日益增加,它的每一个环节都与信息分析紧密相关。从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接、填补序列间隙、到重复序列标识、读框预测和基因标注的每一步都是紧密依赖基因组信息学的软件和数据库。特别是拼接和填补序列间隙更需要把实验设计和信息分析时刻联系在一起。基因组不仅是基因的简单排列,更重要的是它有其特有的组织结构和信息结构,这种结构是在长期的演化过程中产生的,也是基因发挥其功能所必须的。利用国际EST数据库(dbEST)和各实验室测定
2、的相应数据,经过大规模并行计算识别并预测新基因,新SNPs以及各种功能位点,如剪接与可变剪接位点等。到1998年底在人类的约10万个基因中有3万多个已被发现,尚有约7万个未被发现。由于新基因带来的显著经济效益和社会效益,它们成为了各国科学家当前争夺的热点。EST序列(ExpressedSequenceTags)到1999年12月已搜集了约200万条,它大约覆盖了人类基因的90%,因此如何利用这些信息发现新基因成了近几年的重要研究课题。同时1998年国际上又开展了以EST为主发现新SNPs的研究。因此利用EST数据库发现新基因、新SNPs以
3、及各种功能位点是近几年的重要研究方向。虽然对约占人类基因组95%的非编码区的作用人们还不清楚,但从生物进化的观点看来,这部分序列必定具有重要的生物功能。普遍的认识是,它们与基因在四维时空的表达调控有关。寻找这些区域的编码特征,信息调节与表达规律是未来相当长时间内的热点,是取得重要成果的源泉。在不同物种、不同进化水平的生物的相关基因之间进行比较分析,是基因研究的重要手段。目前,模式生物全基因组序列数据越来越多,因此,基因的比较研究,也必须从基因的比较,上升到对不同进化水平的生物在全基因组水平上的比较研究。这样的研究将更有效地揭示基因在生命系
4、统中的地位和作用,解释整个生命系统的组成和作用方式。6.1基因组序列分析工具1.Wisconsin软件包(GCG)GeneticsComputerGroup公司开发的Wisconsin软件包,是一组综合性的序列分析程序,使用公用的核酸和蛋白质数据库。SeqLab是其图形用户界面(GUI),通过它可以使用所有Wisconsin软件包中的程序及其支持的数据库。此外,它还提供了一个环境用于创建、显示、编辑和注释序列。SeqLab也可以被扩展使其可以包括其它公用或非公用的程序和数据库。Wisconsin软件包由120多个独立的程序组成,每个程序进
5、行一项单一的分析任务。包括所有程序的完整目录以及详细的描述可以在Wisconsin软件包的程序使用文档中找到。GCG支持两种核酸数据库(GenBank数据库,简化版的EMBL核酸序列数据库)和三种蛋白质数据库(PIR,SWISS-PROT,SP-TrEMBL)。这些数据库既有GCG格式的(供大多数Wisconsin软件包程序使用),也有BLAST格式的(供BLAST数据库搜索程序使用)。同时还提供了用于LookUp程序以及数据库参考搜索的索引。关于GCG,Wisconsin软件包,支持的平台以及硬件需求的一般性信息可以在GCG的主页以及W
6、isconsin软件包的用户手册中找到。GCG主页提供了更新信息以及Wisconsin软件包程序的完整列表。SeqLab中可以使用多个序列分析程序的特性使用户可以应用这些程序顺序地回答相关问题或在对输入序列进行编辑后重复某项分析。而可以同时访问公用数据库和本机序列的优点使用户可以在一个分析中使用其中任意一种而不用先进行转换或格式化的工作。SeqLab可以解决的序列分析问题:(1)在两条mRNA中寻找开放阅读框架,翻译并对比RNA与蛋白质序列对两条相关的mRNA进行测序的用户可能希望寻找开放阅读框架(ORF)、翻译以及进行核酸与氨基酸序列间
7、的两两对比。把序列加入SeqLabEditor中,从Functions菜单中选中Map选项运行Map程序。Map输出文件包含了限制性酶切图和6种可能的翻译框架的ORF的显示。这些ORF的起始和终止位置可进行标记并选为SeqLabEditor中序列显示的范围,然后可用Edit菜单的Translate操作进行翻译。翻译结果自动出现在SeqLabEditor中。两条相关的核酸或蛋白质序列可用Gap程序或BestFit程序进行对比。Gap程序寻找两条序列间的全局最优对比结果。适用于两条待比对的序列是进化相关的情况。BestFit程序寻找两条序列的
8、局部最优对比结果,它适用于两条序列不是进化相关而是功能相关的情况。(2)通过参考搜索寻找数据库中的相关条目并进行对比研究一个特征序列家族成员的用户可能希望寻找这个家族中的其它成员并建立它们的多
此文档下载收益归作者所有