生物信息学上机实验2019--更新ppt课件.ppt

生物信息学上机实验2019--更新ppt课件.ppt

ID:59763046

大小:6.07 MB

页数:45页

时间:2020-11-23

生物信息学上机实验2019--更新ppt课件.ppt_第1页
生物信息学上机实验2019--更新ppt课件.ppt_第2页
生物信息学上机实验2019--更新ppt课件.ppt_第3页
生物信息学上机实验2019--更新ppt课件.ppt_第4页
生物信息学上机实验2019--更新ppt课件.ppt_第5页
资源描述:

《生物信息学上机实验2019--更新ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、生物信息学上机练习生物序列的信息检索多序列比对及进化树的构建(选做)Phylip使用1,序列的数据库信息检索示例:待查询序列:CCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGAACTGGCCCTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCGGATGGCCGAGGCTGGCTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGTGTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCCAGATGACGACCCCATAGAGGAACATAAAAAG

2、CATTCGTCCGGTTGCGCTTTCCTTTCTGTCAAGAAGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACAGAGAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAAAGAATTTGAGGAAACTGCGGAGAAAGTGCGCCGTGCCATCGAGCAGCTGGCTGCCATGGATTGAGGCCTCTGGC问题1,这是什么基因?基因的标识符是什么?在基因组上的定位是怎样的?2,编码的蛋白质多少个氨基酸?序列标识符为?序列是?3,该蛋白没有保守的功能结构域?4,该

3、蛋白亚细胞定位是?它的功能是怎样的?5,该蛋白在真核生物中是否保守?6,该蛋白有没有三级结构信息?答案1.该基因为人的BIRC5基因;基因标识符:NM_001168.2;染色体定位:17号染色体,76210277..76221716;2.人的BIRC5蛋白质包含142个氨基酸,序列标识符为:NP_001159.2;序列为:MGAPTLPPAWQPFLKDHRISTFKNWPFLEGCACP…3.BIRC5具有保守的功能结构域BIR;4.BIRC5的细胞亚定位:胞质,核;其功能有:(1)在瘤形成过程中可能起一定作用;(2)阻碍G2/M期的细胞编程性凋亡;(3

4、)Chromosomalpassengercomplex(CPC)的成员之一。等等。5.该基因在真核生物中最保守很可能是来自毛猩猩Pongoabelii的BIRC5蛋白:Q5RAH9;6.该蛋白的三级结构已知,在PDB中的标识符为1E31等。2,多序列比对及进化树构建构建CytochromeC1家族进化树在Uniprot数据库中搜索CytochromeC1在不同物种中的氨基酸序列,下载fasta文件使用MEGA软件对结果进行分析:1)多序列比对(MSAmultiplesequencealignment)2)构建进化树CytochromeC1家族序列获取工具

5、网站uniprot.org/advancedsearchcustomize调整结果显示格式选择想要显示的内容,例如显示列为EntrynameOrganismSequenceProteinnamessave以蛋白名称:CytochromeC1为关键词搜索搜索结果编辑Fasta序列文件选择搜索结果中Entryname以“CY1_”开头的序列(选十几个物种序列,每一个种属只选一个序列,即entryname一样的只选择一个即可)点retrieve编辑Fasta序列文件DownloadFASTA格式的文件直接下载下来的序列名称会很累赘,可以将该文件以文本

6、形式打开,对序列名称进行编辑,让其看起来更加简洁明了Fasta文件格式以>为开头,后接序列名称,重启一行,输入序列>CY1_BOVINMAAAAATLRGAMVGPRG…>CY1_YEASTMFSNLSKRWAQRTLSKS…>CY1_HUMANMAAAAASLRGVVLGPRG…>…Fasta文件要求序列名称中不含有‘=’字符氨基酸序列可以分成多行,但内部不要有空格每个序列的title仅保留蛋白/基因名称+种属来源,如:CY1_YEASTMEGA5软件使用打开MEGA5,拉开Align菜单,选择Edit/BuildAlignmentMEGA5软件使用Cr

7、eatanewAlignment选择ProteinMEGA5软件使用在新弹出的窗口中,选择Data->Open->RetrieveSequencesfromFile,然后导入刚才保存的fasta文件多序列比对Ctrl+A选择全部序列,Aligment->AlignbyClustalW多序列比对可以修改各补偿值等参数,点OK多序列比对多序列比对完成Dateexportalignment,导出MEGEformat和Fastaformat两份结果,得到一个*.meg文件和一个*.fas文件进化树构建关闭Alignment窗口,回到MEGA软件主窗口,File-

8、>OpenAFile/Session,打开之前保存的*.meg文件

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。