中国科技大学课件系列生物信息学.ppt

中国科技大学课件系列生物信息学.ppt

ID:58052012

大小:4.78 MB

页数:71页

时间:2020-09-04

中国科技大学课件系列生物信息学.ppt_第1页
中国科技大学课件系列生物信息学.ppt_第2页
中国科技大学课件系列生物信息学.ppt_第3页
中国科技大学课件系列生物信息学.ppt_第4页
中国科技大学课件系列生物信息学.ppt_第5页
资源描述:

《中国科技大学课件系列生物信息学.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、生物信息学第三章序列比对Ⅱ本章内容提要第一节:数学基础:概率及概率模型第二节:双序列比对算法的介绍Dotmatrix动态规划算法(Needleman-Wunsch,Smith-Waterman算法)FASTA和BLAST算法第三节:打分矩阵及其含义第四节:多序列比对第三节打分矩阵及其含义1,计分方法2,Dayhoff:PAM系列矩阵3,Henikoff:BLOSUM系列矩阵1,计分方法匹配计分:UM矩阵(Unitarymatrix)相同的氨基酸记1分,否则记0分。BLAST中核酸比对结构域性质计分

2、:SGM矩阵(Structure-GeneticMatrix)主要根据氨基酸的结构和化学性质的相似程度来记分(如D和E,S和T,V和I有很高的相似性),同时还考虑密码子之间相互转换的难易程度。可观测变换计分:PAM矩阵(PointAcceptedMutation)BLOSUM矩阵(BLOcksSUbstitutionMatrix)2,PAM系列矩阵MargaretDayhoff,1978;通过对物种进化的研究,根据一种氨基酸被另一种氨基酸替代的频度而提出的,最常用的是PAM250;Accepted

3、pointmutation(PAM):可接受的点突变,氨基酸的改变不显著影响蛋白质的功能;PAM矩阵71个蛋白质家族的1572种变化;序列相似性>85%;功能同源的蛋白质通过中性进化,引入可接受的点突变;进化模型:A.基本假设:中性进化,Kimura,1968;B.进化的对称性:A->B=B->A;C.扩展性:通过对较短时间内氨基酸替代关系的计算来计算较长时间的氨基酸替代关系;PAM1矩阵两个蛋白质序列的~1%氨基酸发生变化;定义进化时间以氨基酸的变异比例为准,而不是时间;因为各个蛋白质家族进化

4、的速度并不相等;PAM2=PAM1*PAM1PAM3=(PAM1)3PAM250=(PAM1)250PAMn矩阵的构建选取多个家族的相似性>85%的保守序列;根据匹配计分进行多重比对(不含空位);以比对结果构建进化树,反映氨基酸替换关系;计算每种氨基酸转换成其它氨基酸的次数;计算每种氨基酸突变率;计算每对氨基酸突变率,得到突变概率矩阵,将此矩阵自乘n次;将突变概率矩阵转化为PAMn矩阵。例6:PAM矩阵的构建已知3个蛋白质家族若干保守序列片段:家族一:FKILK,FKIKK,FFILL,FFIKL

5、家族二:IIFFF,IIFIF,IKFFL,IKFIL家族三:KIFKK,KIFLK,KLFKL,KLFLL按Doyhoff方法构建PAM1与PAM2矩阵Step1:多重比对位置对齐,多重比对(不考虑空位):统计每种氨基酸出现的频率;fi=氨基酸i的数目/总氨基酸数目fL=12/60=0.2..家族一家族二家族三FKILKIIFFFKIFKKFKIKKIIFIFKIFLKFFILLIKFFLKLFKLFFIKLIKFILKLFLLStep2:构建进化树最大简约法家族一:L和K间相互转换次数:N(L

6、K)=3家族二,家族三…FKILKFKIKKFKIKKFFIKLFFILLFFIKL(LK)(KF)(LK)(LK)Step3:计算氨基酸间的转换次数计算每种氨基酸转换成其它氨基酸的次数。假设两种氨基酸间相互转换一样。e.g.N(LK)=3+0+3=6KFILK116F121I121L611Step4:计算各氨基酸相对突变率每种氨基酸相对突变率mii:第i种氨基酸;fi:每种氨基酸出现的频率;mK=8/(12×2×fK×100)=0.0125…Step5:计算氨基酸i替换为

7、j的突变率氨基酸i替换为j的突变率mije.g.mKK=1-mK=0.9875mKF=mF×1/4=0.001389…Step5:氨基酸一步转移概率矩阵氨基酸突变概率——一步转移概率矩阵M1ij原氨基酸KFIL替换氨基酸K0.98750.0015630.0015630.009375F0.0013890.9944440.0027780.001389I0.0017860.0035710.9928570.001786L0.01250.0020830.0020830.983333Step6:计算PAM1计

8、分矩阵由突变率mij计算计分矩阵中的分值rij:将rij=rji取平均值,再取整数;(按先前假设,rij=rji)rKK=10lg(mkk/fk)=5.6857≈6(rKF+rFK)/2=-22.833≈-23…Step6:PAM1计分矩阵结果三个家族序列片段得到的PAM1计分矩阵:KFILK6F-235I-22-196L-13-22-207Step7:计算PAM2计分矩阵将氨基酸突变概率矩阵自乘一次,得到两步转移概率矩阵M2ijM2ij=M1ij×M1ij三个家族序列片段得到的P

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。