生物信息学复习小结(中科大)

ID：38804716

大小：100.23 KB

页数：5页

时间：2019-06-19

资源描述：

《生物信息学复习小结(中科大)》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、第二章：序列的采集和存储2. 序列数据的存储r核酸序列数据库Ø国际三大核酸序列数据库：GenBank,EBML,DDBJØdbEST:ExpressedSequencesTags数据库ØUniGene等rRefSeq:TheReferenceSequenceDatabaser蛋白质序列数据库ØUniProtØSwiss-prot&TrEMBL,PIRr基因组数据库:Ensembl第三章序列比对I序列间比对的对应关系：匹配、替代、缺失、插入双序列比对算法：Dotmatrix（点阵法）动态规划算法wNeedleman-Wunsch算法rSij=maxofSi-

2、1,j-1+σ(xi,yj)Si-1,j-d(从左到右)Si,j-1-d(从上到下)wSmith-Waterman算法Sij=maxof0Si-1,j-1+σ(xi,yj)Si-1,j-d(从左到右)Si,j-1-d(从上到下)FASTA和BLAST算法PSI-BLAST（位点特异性迭代BLAST）：1.使用普通的blast算法进行搜索；2.将搜索得到的序列，包括输入的序列放在一起，构建位点特异性的矩阵(PositionSpecificMatrix);3.利用上面得到的矩阵谱(profile)，再次在数据库中进行搜索；4.重复2，3步，直到不再有新的序列出

3、现；PHI-BLAST : 模式发现迭代BLAST第三章序列比对Ⅱ打分矩阵及其含义r1，计分方法r2，PAM系列矩阵r3，BLOSUM系列矩阵多序列比对：方法改进r1.渐进方法：代表：ClustalW/X,T-Coffee（1）ClustalW/X：计算过程1.将所有序列两两比对，计算距离矩阵；2.构建邻接进化树(neighbor-joiningtree)/指导树(guidetree)；3.将距离最近的两条序列用动态规划的算法进行比对；4.“渐进”的加上其他的序列。(2) T-Coffeer采用Clustal程序计算两两序列之间的全局最优比对结果；r采用L

4、ALIGN程序计算两两序列之间的局部最优比对的结果；r设计加权系统，综合考虑以上两类结果的因素，构建指导库；r最后，采用渐进式比对算法，得到最终的结果。r2.迭代方法：代表:PRRP,DIALIGNr3.部分有向图算法：(POA)r4.全局多序列比对的隐马尔科夫模型profileHMMr5.整合算法：MUSCLE性能比较rProbCons：目前综合性能最好；rT-Coffee：序列相似性高时最准确；rDIALIGN:序列相似性低时最准确；rPOA：性能接近T-Coffee和DIALIGN，速度最快；rClustalW/X:最经典、被广泛接受的工具；rMUS

5、CLE:目前最流行的多序列比对工具；第四章分子进化与系统发育分析rOrtholog(直系同源物)：两个基因通过物种形成的事件而产生，或源于不同物种的最近的共同祖先的两个基因，或者两个物种中的同一基因，一般具有相同的功能。rParalog(旁系同源物)：两个基因在同一物种中，通过至少一次基因复制事件产生。常常具有不同功能。相似性(Similarity)序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占比例；同源性(Homology)两个基因或蛋白质序列具有共同祖先的结论；RSCU相对同义密码子使用度CAI：密码子适应指数（该值越小

6、表示偏性越强）P–distance：两条蛋白质序列之间的氨基酸差异数为nd,序列的氨基酸数目均为n，则P距离：泊松距离：d=-ln(1-p)分子系统发育分析：建树方法：ØA.最大简约法ØB.距离法ØC.最大似然性法ØD.贝叶斯（Bayesian）推断系统发育树：三种类型分支图进化树时间度量树系统发育树重建的基本方法：1.最大简约法(maximumparsimony,MP)Ø适用序列有很高相似性时r2.距离法(distance)Ø适用序列有较高相似性时r3.最大似然法(maximumlikelihood,ML)Ø可用于任何相关序列集合系统发育分析软件：PHY

7、LIPMEGAPAUP第五章：生物序列的数据库信息检索序列家族分类及功能数据库：r蛋白质序列分类数据库-Pfamr蛋白质序列功能位点数据库PROSITErGeneOntology（GO）r相互作用的蛋白质数据库DIPr转录调控区数据库TRRD33，检索系统rNCBI：EntrezrEBI：SRSrExPASyE-ValuerExpectvalue：在一个特定大小的数据库中碰巧搜索到打分值约为Score的不同序列的个数。rE值随Score增加，呈指数减少第六章：序列模式识别常用的检验指标：.敏感性特异性选择性PSSM2种GibbsSampler算法：1.从每

8、条序列上随机的抽取一段序列，序列长度固定2.构建PSSM/权重矩阵

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 5



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

生物信息学复习小结(中科大)

生物信息学复习小结(中科大)

相关文章

相关标签