基于距离的系统发生分析

基于距离的系统发生分析

ID:36261516

大小:1.44 MB

页数:43页

时间:2019-05-07

基于距离的系统发生分析_第1页
基于距离的系统发生分析_第2页
基于距离的系统发生分析_第3页
基于距离的系统发生分析_第4页
基于距离的系统发生分析_第5页
资源描述:

《基于距离的系统发生分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章基于距离的系统发生分析www.biodiscover.com第四章基于距离的系统发生分析分子系统发生学的历史4.1分子系统发生分析的优点4.2系统发生树4.3距离矩阵法4.4最大似然法4.5多重序列比对4.6www.biodiscover.com4.1分子系统发生学的历史系统发生学是研究物种之间的进化关系的,是进化生物学的一个重要研究领域,系统发生分析在达尔文时代就已经开始。从那时起,科学家们就开始寻找物种的源头,分析物种之间的进化关系,给各个物种分门别类。CharlesDarwin(1809-1882)ww

2、w.biodiscover.com4.1分子系统发生学的历史20世纪70年代20世纪60年代20世纪50年代1902和1904研究者开始能够获得基因组信息,特别是DNA序列蛋白质测序成为可能分子数据开始被广泛应用于系统发生研究正确地推断出人和猿比它们和其它灵长类动物有更近的共同祖先20世纪70年代后至今研究者一直致力于研究DNA序列以及基因组信息,目前DNA数据比任何分子信息都要丰富www.biodiscover.com4.2分子系统发生分析的优点表型分析①具有一定的局限性②许多生物体没有可用来进行比较的易于研究的

3、表型③什么样的表型特征能用来比较也不特别明了比较分析分子系统发生分析基于DNA和蛋白质序列的分析,能够克服表型分析的缺点问题,能够对生物体进行正确的分组,对于所得数据比较可靠。表性分析:利用生物体的外观比较来推断生物体的基因型,如外形相似即表型相似则认为编码表型的基因也相似;反之,表型不同,基因也不同。www.biodiscover.com4.3系统发生树概念系统发生树:三个或者更多基因或生物体之间进化关系的典型图示;大部分系统发生研究都是围绕系统发生树的概念进行的,它不仅表示了数据之间的关系,还体现了他们的分歧时

4、间和他们共同祖先的特征。www.biodiscover.com4.3系统发生树重建系统发生树的术语4.3.1有根树和无根树4.3.2基因树和物种树4.3.3特征和距离数据4.3.4www.biodiscover.com4.3.1重建系统发生树的术语系统发生树有时也称为系统树图,它是由一系列的节点和分支组成的,其中每个节点代表一个分类单元。分支末端的节点(外部节点)对应一个基因或生物体;内部节点代表一个推断的共同祖先,它在过去的某个时候分歧出两个独立的分支。www.biodiscover.com4.3.1重建系统发生

5、树的术语www.biodiscover.com4.3.1重建系统发生树的术语5个物种(Ⅰ,Ⅱ,Ⅲ,Ⅳ,Ⅴ)之间的进化关系的系统发生树ABCDⅠⅡⅢⅣⅤ系统发生树结构的基本信息在计算机程序中常用一组嵌套的圆括号表示,称为Newick格式,用该格式来表示上图中的树,可写成(((Ⅰ,Ⅱ),(Ⅲ,Ⅳ)),Ⅴ)外部节点内部节点根节点www.biodiscover.com4.3.2有根树和无根树ⅠⅡⅢⅣⅤ根时间ⅠⅡⅢⅣⅤ⑴有根树⑵无根树有根树种,单一的节点指派为共同的祖先,从祖先节点只有唯一的路径进化到达其他任何节点。无根树只

6、表明了节点之间的关系,而没有关于进化发生方向的信息;www.biodiscover.com4.3.2有根树和无根树只考虑3个物种的时候,有3棵有根树,一棵无根树,如下图所示:ⅠⅡⅠⅡⅢⅠⅢⅡⅡⅢⅠⅢ有根树无根树www.biodiscover.com4.3.2有根树和无根树描述少量物种之间可能的进化关系的有根树和无根树的数目物种数目有根树数目无根树数目211331415351051510344594252207025152134580467678757905853580625208200794532637891559

7、375221643095476699771875n个物种可能的有根系统发生树(NR)和无根系统发生树(NU)数目可用下面的公式计算得到:NR=(2n-3)!∕2n-2(n-2)!NU=(2n-5)!∕2n-3(n-3)!只有一棵树代表了(基因或物种)的实际系统发生关系!www.biodiscover.com4.3.3基因树和物种树区别:基因树为基于单个同源基因差异构建的系统发生树;物种树一般从多个基因数据中分析得出。只考虑一个基因的时候个体可能表现出与其他物种的成员关系更近。基因分化事件常常在物种形成前或后发生。w

8、ww.biodiscover.com4.3.4特征和距离数据用于构建系统发生树的分子数据分成两类:(1)距离(distances)数据,常用距离矩阵描述,表示两个数据集之间所有两两差异;(2)特征(characters)数据,表示分子所具有的特征。DNA和蛋白质序列数据描述离散的特征;一旦建立了确定所有可能状态之间相似性的标准,特征数据就很容易转化成距离数据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。