生物信息学复习小结(中科大)

生物信息学复习小结(中科大)

ID:38804716

大小:100.23 KB

页数:5页

时间:2019-06-19

生物信息学复习小结(中科大)_第1页
生物信息学复习小结(中科大)_第2页
生物信息学复习小结(中科大)_第3页
生物信息学复习小结(中科大)_第4页
生物信息学复习小结(中科大)_第5页
资源描述:

《生物信息学复习小结(中科大)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章:序列的采集和存储2. 序列数据的存储r核酸序列数据库Ø国际三大核酸序列数据库:GenBank,EBML,DDBJØdbEST:ExpressedSequencesTags数据库ØUniGene等rRefSeq:TheReferenceSequenceDatabaser蛋白质序列数据库ØUniProtØSwiss-prot&TrEMBL,PIRr基因组数据库:Ensembl第三章序列比对I序列间比对的对应关系:匹配、替代、缺失、插入双序列比对算法:Dotmatrix(点阵法)动态规划算法wNeedleman-Wunsch算法rSij=maxofSi-

2、1,j-1+σ(xi,yj)Si-1,j-d(从左到右)Si,j-1-d(从上到下)wSmith-Waterman算法Sij=maxof0Si-1,j-1+σ(xi,yj)Si-1,j-d(从左到右)Si,j-1-d(从上到下)FASTA和BLAST算法PSI-BLAST(位点特异性迭代BLAST):1.使用普通的blast算法进行搜索;2.将搜索得到的序列,包括输入的序列放在一起,构建位点特异性的矩阵(PositionSpecificMatrix);3.利用上面得到的矩阵谱(profile),再次在数据库中进行搜索;4.重复2,3步,直到不再有新的序列出

3、现;PHI-BLAST : 模式发现迭代BLAST第三章序列比对Ⅱ打分矩阵及其含义r1,计分方法r2,PAM系列矩阵r3,BLOSUM系列矩阵多序列比对:方法改进r1.渐进方法:代表:ClustalW/X,T-Coffee(1)ClustalW/X:计算过程1.将所有序列两两比对,计算距离矩阵;2.构建邻接进化树(neighbor-joiningtree)/指导树(guidetree);3.将距离最近的两条序列用动态规划的算法进行比对;4.“渐进”的加上其他的序列。(2) T-Coffeer采用Clustal程序计算两两序列之间的全局最优比对结果;r采用L

4、ALIGN程序计算两两序列之间的局部最优比对的结果;r设计加权系统,综合考虑以上两类结果的因素,构建指导库;r最后,采用渐进式比对算法,得到最终的结果。r2.迭代方法:代表:PRRP,DIALIGNr3.部分有向图算法:(POA)r4.全局多序列比对的隐马尔科夫模型profileHMMr5.整合算法:MUSCLE性能比较rProbCons:目前综合性能最好;rT-Coffee:序列相似性高时最准确;rDIALIGN:序列相似性低时最准确;rPOA:性能接近T-Coffee和DIALIGN,速度最快;rClustalW/X:最经典、被广泛接受的工具;rMUS

5、CLE:目前最流行的多序列比对工具;第四章分子进化与系统发育分析rOrtholog(直系同源物):两个基因通过物种形成的事件而产生,或源于不同物种的最近的共同祖先的两个基因,或者两个物种中的同一基因,一般具有相同的功能。rParalog(旁系同源物):两个基因在同一物种中,通过至少一次基因复制事件产生。常常具有不同功能。相似性(Similarity)序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占比例;同源性(Homology)两个基因或蛋白质序列具有共同祖先的结论;RSCU相对同义密码子使用度CAI:密码子适应指数(该值越小

6、表示偏性越强)P–distance:两条蛋白质序列之间的氨基酸差异数为nd,序列的氨基酸数目均为n,则P距离:泊松距离:d=-ln(1-p)分子系统发育分析:建树方法:ØA.最大简约法ØB.距离法ØC.最大似然性法ØD.贝叶斯(Bayesian)推断系统发育树:三种类型分支图进化树时间度量树系统发育树重建的基本方法:1.最大简约法(maximumparsimony,MP)Ø适用序列有很高相似性时r2.距离法(distance)Ø适用序列有较高相似性时r3.最大似然法(maximumlikelihood,ML)Ø可用于任何相关序列集合系统发育分析软件:PHY

7、LIPMEGAPAUP第五章:生物序列的数据库信息检索序列家族分类及功能数据库:r蛋白质序列分类数据库-Pfamr蛋白质序列功能位点数据库PROSITErGeneOntology(GO)r相互作用的蛋白质数据库DIPr转录调控区数据库TRRD33,检索系统rNCBI:EntrezrEBI:SRSrExPASyE-ValuerExpectvalue:在一个特定大小的数据库中碰巧搜索到打分值约为Score的不同序列的个数。rE值随Score增加,呈指数减少第六章:序列模式识别常用的检验指标:.敏感性特异性选择性PSSM2种GibbsSampler算法:1.从每

8、条序列上随机的抽取一段序列,序列长度固定2.构建PSSM/权重矩阵

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。