第五章基于特征的系统发生分析-生命科学与技术学院

第五章基于特征的系统发生分析-生命科学与技术学院

ID:44979242

大小:1.45 MB

页数:51页

时间:2019-11-06

第五章基于特征的系统发生分析-生命科学与技术学院_第1页
第五章基于特征的系统发生分析-生命科学与技术学院_第2页
第五章基于特征的系统发生分析-生命科学与技术学院_第3页
第五章基于特征的系统发生分析-生命科学与技术学院_第4页
第五章基于特征的系统发生分析-生命科学与技术学院_第5页
资源描述:

《第五章基于特征的系统发生分析-生命科学与技术学院》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第五章:基于特征的系统发生分析生命科学与技术学院阎爱侠分子系统发生分析主要分成三个步骤:(1)分子序列或特征数据的分析;(2)系统发生树的构造;(3)结果的检验。其中,第一步的作用是通过分析,产生距离或特征数据,为建立系统发生树提供依据。构成系统发生树的分子数据:特征数据基于特征的系统发生分析距离数据基于距离的系统发生分析关于进化关系的结论的一致性可以看作是对一棵系统发生树的正确性的积极认可。5.1简约法在生物学中,描述按照进化途径中突变事件最少的标准来优先选择一个进化途径的过程。两个简单假设:(1)突变是罕见事件;(2)一个模型引发了越不合理的事件,这个模型就越不可能是正确的。因

2、此,突变最少的进化关系就越有可能是物种之间真实的进化关系。4个物种三种可能的无根树1234132414235.1.1信息位点和非信息位点根据信息内容可以分为:信息位点(informative):含有信息的位点信息位点就是指能由位点产生的突变数目把一棵树与其它树区分开来的位点;非信息位点(uninformative):不含有信息的位点不变位点(invariant):属于非信息位点,比较的所有序列都有同样的核苷酸。即每一棵描述所有序列间进化关系的树都有相同的突变数目(0)。((1,2)(3,4))((1,3)(2,4))((1,4)(2,3))序列位点1位点2位点3位点4位点5位点61

3、GGGGGG2GGGAGT3GGATAG4GATCAT图5.14条同源序列的比对(每条序列有6个核苷酸)6个位点构造4个物种之间进化关系的可能无根树不变位点序列位点1位点2位点3位点4位点5位点61GGGGGG2GGGAGT3GGATAG4GATCAT((1,2)(3,4))((1,3)(2,4))((1,4)(2,3))不变位点非信息位点序列位点1位点2位点3位点4位点5位点61GGGGGG2GGGAGT3GGATAG4GATCAT不变位点非信息位点非信息位点((1,2)(3,4))((1,3)(2,4))((1,4)(2,3))序列位点1位点2位点3位点4位点5位点61GGGG

4、GG2GGGAGT3GGATAG4GATCAT不变位点非信息位点非信息位点非信息位点((1,2)(3,4))((1,3)(2,4))((1,4)(2,3))序列位点1位点2位点3位点4位点5位点61GGGGGG2GGGAGT3GGATAG4GATCAT不变位点非信息位点非信息位点非信息位点信息位点((1,2)(3,4))((1,3)(2,4))((1,4)(2,3))序列位点1位点2位点3位点4位点5位点61GGGGGG2GGGAGT3GGATAG4GATCAT不变位点非信息位点非信息位点非信息位点信息位点信息位点((1,2)(3,4))((1,4)(2,3))((1,3)(2,4

5、))T信息位点的共同特征:如果一个位点是信息位点,那么它(1)至少有两种不同的核苷酸,并且(2)这些核苷酸至少出现两次。5.1.2无权简约法最简约树:考虑每个信息位点所有可能的树,分别给每棵树进行打分,统计每个位点的核苷酸最小替换数目。所有简约信息位点最小核苷酸替换数的总和最小的树记为最简约树。4条序列比对的例子可能是最简单的例子:在只包含4条序列的分析中,每个信息位点只能支持3棵可能的树中的1棵,含有最多信息位点的树就是最简约树。5条或更多序列数据集的计算复杂得多。原因在于:⑴随序列数增加,无根树数目也增加;⑵每个信息位点可能有多棵树,整个数据集的最大简约树不一定是含最多信息位点

6、的树;⑶每棵树的核苷酸替换数目的计算更加困难。n个物种可能得到无根系统发生树(Nu)数目:Nu=(2n-5)!/2n-3(n-3)!下图是描述5条不同序列之间关系的15棵可能无根树中的3棵。这3棵无根树有相同的简约度,它们的最小替换数都是2。由简约规则,推断出的祖先的候选核苷酸分别列在每个内部节点的旁边。T512346789GGAAGA(GA)(GAT)(a)A123456789GGTAGA(GT)(GTA)(b)123456789GTGAAGGA(GA)(c)计算祖先核苷酸位置的算法:如果一个内部节点的两个直接后代节点上的核苷酸的交集非空,那么这个节点的最可能的候选核苷酸集就是这

7、个交集;否则为它的两个后代节点上的核苷酸集的并集。上述方法只适用于信息位点,不适用于非信息位点。非信息位点的最小替换数:外部节点上不同核苷酸数目减去1(与树的拓扑结构无关)例如:5条序列的比对中,有一个位置上的核苷酸是G、G、A、G和T,则最小替换数就是3-1=2。非信息位点对所有可能的树的贡献都是等价的,在简约分析中往往被完全排除。树的长度(length):当一棵树在信息位点和非信息位点的替换数的总和是一个确定的数值时,这个数值就是指树的长度。5.1.3加权简约法赋

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。