欢迎来到天天文库
浏览记录
ID:34508493
大小:1.02 MB
页数:32页
时间:2019-03-07
《马尔柯夫及隐马尔柯夫模型 dna 序列分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、7.91/7.36/BE.490第四讲2004.3.4马尔柯夫及隐马尔柯夫模型DNA序列分析ChrisBurge课程结构课时主题模型结构相关加权矩完全独立阵模型隐马尔柯局部相关夫模型能量模型,共非局部相关变模型DNA的马尔柯夫及隐马尔柯夫模型剪接位点的马尔柯夫模型隐马尔柯夫模型——在头巾下观看威特比(Viterbi)演算法真实世界中的隐马尔柯夫模型DNA基序构建及发现简介剪接位点的加权矩阵模型(WMMs)模体(motif)代表的信息模体的寻找或发现问题吉布斯采样法模体构建——加权矩阵之上DNA、RNA基序包含的信息信息熵(s
2、hannonentropy)信息/位置随机序列中每2m个碱基将产生一个包含m比特信息的模体变量对发现基序的影响L=序列平均长度N=序列编码I=模体包含的信息W=模体宽度怎样识别5’ssRNA热力学I螺旋构型自由能来自于:碱基配对:碱基堆积:DougTurner’s能量规则:RNA热力学很多连续碱基对-好内部环-坏终端碱基对不稳定-坏总的来说,A比B、C更稳定5’ss序列中的条件频率5’ss在+5处含有5’ss在+5处没有GG数据来源:Burge,1998,分子生物学中的计算方法哪一种模型能够表现位置之间的相互关系?马尔柯夫模型专业术语随机变量
3、(RV):可以假定为任意一系列的值,其中每一个值都有一定的出现可能性例如:X=一个骰子滚动的结果两个骰子的过程:X,X,X……连续骰子滚动123随机过程:随意过程或是随机变量的序列什么是马尔柯夫模型(aka马尔柯夫链)?传统定义离散地随机过程X,X,X……123它拥有马尔柯夫性质:换句话来说就是:它是一个随机过程,具有将来(下一个状态)有条件地与过去存在(现在状态)相互独立的性质。Markov–俄罗斯数学家,ca.1922不同类的一阶马尔柯夫模型马尔柯夫模型的估计参数更长排列相关是什么?——k顺序马尔柯夫模型k顺序马尔柯夫模型大约有4k+1个
4、参数或位置不同类同类人类5’ss序列的加权矩阵模型(WMM)与马尔柯夫一阶模型比较剪接模型I5’剪接点分枝位点3’剪接点剪接模型Ⅱ过渡联合体联合体交叉内含子外显子定义联合体5‘剪接位点多嘧啶3’剪接位剪接体前体联合体分枝点点序列剪接体关于人类Pre-mRNA剪接的一个新近模型SR=SR蛋白质家族剪接因子成员ESE=外显剪接增强子交叉外显交叉外显交叉内含ESEs是一些短模体,它提高了在所有构建和选择剪接外显子中邻近剪接位点的识别能力—精确序列需求不能很好地表现。隐马尔柯夫模型akaHMMs马尔柯夫模型序列比对序列比对序列比对的隐马尔柯夫模型配对
5、状态插入状态删除状态转换可能性马尔柯夫和隐马尔柯夫模型CpG岛CpG岛隐马尔柯夫模型CpG岛隐马尔柯夫模型ⅡCpG岛隐马尔柯夫模型Ⅲ想推断观测但是HMM写在其它方向(依靠隐藏才可见)从可见的推断隐藏部分(贝叶斯法则)条件prob:P(A
6、B)=P(A,B)/P(B)计算稍微有点困难注意:即因此可视为常数将寻找最佳“分列”(viterbi算法)寻找隐藏状态的顺序连接概率最佳化:序列最佳”分列“解决方案:定义R(h)=在以状态h结束情况下,子序列i1…i最佳分列的概率递归解答,例如:根据R(h)确定1R(h)。2Viterbi算法“格架”图表序列
7、中的位置藏隐层长度为L的序列k层隐马尔柯夫模型运行时间HMMs的发展有用的HMMs的发展
此文档下载收益归作者所有