多重序列比对及系统发生树的构建

多重序列比对及系统发生树的构建

ID:38520109

大小:400.00 KB

页数:9页

时间:2019-06-14

多重序列比对及系统发生树的构建_第1页
多重序列比对及系统发生树的构建_第2页
多重序列比对及系统发生树的构建_第3页
多重序列比对及系统发生树的构建_第4页
多重序列比对及系统发生树的构建_第5页
资源描述:

《多重序列比对及系统发生树的构建》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多重序列比对及系统发生树的构建来源:生物谷  2010-1-8  访问量:6568评论(0)分享0【实验目的】1、熟悉构建分子系统发生树的基本过程,获得使用不同建树方法、建树材料和建树参数对建树结果影响的正确认识;2、掌握使用Clustalx进行序列多重比对的操作方法;3、掌握使用Phylip软件构建系统发生树的操作方法。【实验原理】在现代分子进化研究中,根据现有生物基因或物种多样性来重建生物的进化史是一个非常重要的问题。一个可靠的系统发生的推断,将揭示出有关生物进化过程的顺序,有助于我们了解生物进化的历史和

2、进化机制。对于一个完整的进化树分析需要以下几个步骤:⑴要对所分析的多序列目标进行比对(alignment)。⑵要构建一个进化树(phyligenetictree)。构建进化树的算法主要分为两类:独立元素法(discretecharactermethods)和距离依靠法(distancemethods)。所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点

3、状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。独立元素法包括最大简约性法(MaximumParsimonymethods)和最大可能性法(MaximumLikelihoodmethods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。⑶对进化树进行评估,主要采用Bootstraping法。进化树的构建是一个统计学问题,我们所构建出来的进化树

4、只是对真实的进化关系的评估或者模拟。如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的"进化树"。模拟的进化树需要一种数学方法来对其进行评估。不同的算法有不同的适用目标。一般来说,最大简约性法适用于符合以下条件的多序列:i所要比较的序列的碱基差别小,ii对于序列上的每一个碱基有近似相等的变异率,iii没有过多的颠换/转换的倾向,iv所检验的序列的碱基数目较多(大于几千个碱基);用最大可能性法分析序列则不需以上的诸多条件,但是此种方法计算极其耗时。如果分析的序列较多,有可能要花上几天的时间才能计算完

5、毕。UPGMAM(Unweightedpairgroupmethodwitharithmeticmean)假设在进化过程中所有核苷酸/氨基酸都有相同的变异率,也就是存在着一个分子钟。这种算法得到的进化树相对来说不是很准确,现在已经很少使用。邻位相连法是一个经常被使用的算法,它构建的进化树相对准确,而且计算快捷。其缺点是序列上的所有位点都被同等对待,而且,所分析的序列的进化距离不能太大。另外,需要特别指出的是对于一些特定多序列对象来说可能没有任何一个现存算法非常适合它。CLUSTALX和PHYLIP软件能够实现

6、上述的建树步骤。CLUSTALX是Windows界面下的多重序列比对软件。PHYLIP是多个软件的压缩包,功能极其强大,主要包括五个方面的功能软件:i,DNA和蛋白质序列数据的分析软件。ii,序列数据转变成距离数据后,对距离数据分析的软件。iii,对基因频率和连续的元素分析的软件。iv,把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。v,按照DOLLO简约性算法对序列进行分析的软件。vi,绘制和修改进化树的软件。【实验内容】1、使用CLUSTALX软件对已知八条DNA

7、序列(如下)进行多重序列比对;M._mulatta  AAGCTTTTCTGGCGCAACCATCCTCATGATTGCTCACGGACTCACCTCTTM._fascicu  AAGCTTCTCCGGCGCAACCACCCTTATAATCGCCCACGGGCTCACCTCTTM._sylvanu  AAGCTTCTCCGGTGCAACTATCCTTATAGTTGCCCATGGACTCACCTCTTHomo_sapie  AAGCTTCACCGGCGCAGTCATTCTCATAATCGCCCACGGGCTTA

8、CATCCTGorilla     AAGCTTCACCGGCGCAGTTGTTCTTATAATTGCCCACGGACTTACATCATPongo       AAGCTTCACCGGCGCAACCACCCTCATGATTGCCCATGGACTCACATCCTSaimiri_sc  AAGCTTCACCGGCGCAATGATCCTAATAATCGCTCACGGGTTTACTTCGTLemur_cat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。