欢迎来到天天文库
浏览记录
ID:19255091
大小:1.37 MB
页数:33页
时间:2018-09-20
《生物信息学课程设计:h7n9病毒非结构蛋白ns1的基因序列分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、生物信息学课程设计报告题目:H7N9病毒非结构蛋白NS1的基因序列分析专业:班级:学号:姓名:指导教师:2013年12月19日33目录1绪论31.1生物信息学概况31.2软件工具41.3H7N9简介51.4课题目的61.5课题设计的主要内容6本章总结62查找序列并进行Blast分析72.1登录GenBanK并查找H7N9病毒的一段基因序列72.2对序列进行Blast分析12本章总结153.进行多序列比对153.1目标153.2多序列比对过程15本章总结184构建系统发育树194.1目标194.2将.Aln文件转化为.meg文件194.3用Mega5.2构建系统发育树22本章总结265设计引
2、物265.1目标265.2引物设计过程26本章总结326结果分析和讨论326.1结果分析326.2结果讨论32331绪论1.1生物信息学概况生物信息学(Bioinformatics)[1]是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。生物信息学可以定义为对分子生物学中两类信息流的研究:1.第一类信息流源于分子生物学的
3、中心法则:DNA序列被转录为mRNA序列,后者被翻译为蛋白质序列。蛋白质序列继而折叠为具功能的三维结构。按照达尔文演化理论,这些功能被生物体的环境所选择,从而驱动群体中DNA序列的进化。因此,第一类的生物信息学应用关注于中心法则中任一阶段的信息传递,包括DNA序列中基因的组织与控制、确定DNA中的转录单位、从序列预测蛋白质结构以及分子功能分析。2.第二类信息流是基于科学方法:提出关于生物学活动的假设,设计实验以验证这些假设,评估结果与假设的相容性,然后根据实验数据对原假设作扩展或修正。第二类的生物信息学应用关注于这一流程中的信息传递,包括产生假设、设计实验、通过数据库将实验结果组织起来、检
4、验数据与模型的相容性以及修正假设的各个系统。生物信息学的主要研究方向包括:1.序列分析2.计算进化生物学3.生物多样性的度量4.蛋白质结构预测5.蛋白质表达分析6.比较基因组学7.基因表达分析8.调控分析9.生物系统模拟当前一些发达国家的政府、科研机构均非常重视,纷纷建立相应的机构或部门进行这方面的研究、开发和服务。如美国国家生物信息中心(NationalCentreofBiotechnologyInformation,NCBI),欧洲分子生物学网络(EuropeanMolecular33BiologyNetwork,EMBNet)。另外一些生物公司亦非常重视生物信息学并组建相关的部门来从
5、事相应的研发和应用。在我国,生物信息学随着人类基因组研究的展开才刚刚起步,但已显露出蓬勃发展的势头。许多科研单位已经开始或准备开始从事这方面的研究工作。北京大学研究建立起一个EMBL的镜像数据库(http://www.ebi.pku.edu.cn),并提供部分的检索服务。复旦大学遗传学研究所,为克隆新基因而建立的一整套生物信息系统也已初具规模。中科院上海生化所、生物物理所等单位在数据分析和基因预测方面也有相当的基础。、1.2软件工具1.2.1BlastBLAST(BasicLocalAlignmentSearchTool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLA
6、ST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。BLAST是基于Altschul等人在J.Mol.Biol上发表的方法(J.Mol.Biol.215:403-410(1990)),在序列数据库中对查询序列进行同源性比对工作。从BLAST发展到NCBI提供的BLAST2.0,已将有缺口的比对序列也考虑在内了。BLAST可处理任何数量的序列,包括蛋白序列和核酸序列;也可选择多个数据库但数据库必须是同一类型的,即要么都是蛋白数据库要么都是核酸数据库。所查询的序列和调用的数据库则可以是任何形式的组合,既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列
7、到蛋白库中作查询,反之亦然。1.2.2FastaFASTA程序是第一个广泛使用的数据库相似性搜索程序。程序引用取代矩阵实行局部比对以获得最佳搜索。但众所周知,使用这种策略会非常耗费工作时,为了提高速度,在实施耗时的最佳搜索之前,程序使用已知的字串检索出可能的匹配。在速度和敏感度之间权衡选择依赖于ktup参数。它决定了字串的大小。增大ktup参数就会减少字串命中的数目,也就会减少所需要的最佳搜索的数目和搜索的速度。从2.0
此文档下载收益归作者所有