基于密码子偏性和分枝聚类的密码子置换模型的统计推断

基于密码子偏性和分枝聚类的密码子置换模型的统计推断

ID:34283053

大小:352.20 KB

页数:51页

时间:2019-03-04

基于密码子偏性和分枝聚类的密码子置换模型的统计推断_第1页
基于密码子偏性和分枝聚类的密码子置换模型的统计推断_第2页
基于密码子偏性和分枝聚类的密码子置换模型的统计推断_第3页
基于密码子偏性和分枝聚类的密码子置换模型的统计推断_第4页
基于密码子偏性和分枝聚类的密码子置换模型的统计推断_第5页
资源描述:

《基于密码子偏性和分枝聚类的密码子置换模型的统计推断》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中图分类号:O211.9,O213论文编号:102870813-S021学科分类号:070104硕士学位论文基于密码子偏性和分枝聚类的密码子置换模型的统计推断研究生姓名学科、专业研究方向指导教师程珊珊概率论与数理统计应用概率统计刘心声教授南京航空航天大学研究生院理学院二О一二年十二月NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofScienceStatisticalInferenceforcodonsubstitutionmodelsbasedoncodonu

2、sagebiasandBranchClusteringAThesisinMathematicsByChengShanshanAdvisedbyProfessorLiuXinshengSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofScienceDecember,2012承诺书本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的结果。尽我所知,除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人享有著作权的内容。对本论文所涉及的研究工作

3、所做出贡献的其他个体和集体,均已在文中以明确方式标明。本人授权南京航空航天大学可以有权保留送交论文的复印件,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复印手段保存论文。(保密的学位论文在解密后适用本承诺书)作者签名:日期:南京航空航天大学硕士学位论文摘要生物信息学是一门新兴交叉学科,研究内容涉及到生物学、数学和计算机等相关学科的知识。系统发生分析是生物信息学的重要研究内容之一,主要是利用概率统计方法和生物分子数据,对生物进化关系进行推断和评估。基于系统发生学的计算分子进化在进化遗传学、生态学、基

4、因组学、病毒学和发育生物学等实验生物学领域都有很广泛地的应用,而以核苷酸、氨基酸或密码子为数据分类单元的概率置换模型的建立是计算分子进化的重要研究内容,因此,对概率置换模型的研究具有重要的意义。本文主要对基于密码子偏性和分枝聚类的密码子置换模型的参数进行统计推断。本文第二章基于密码子偏性与氨基酸生化距离建立新的密码子置换模型,将新模型应用到两个真实的数据集,并与原模型进行比较来分析新模型对数据的适应性。分析结果表明新模型比未考虑密码子偏性和氨基酸生化距离的模型能更好地拟合数据,对参数的估计更加合理。第三章我们针对进化位点的差异性,首先利用聚类分析法判断物种

5、间的相似度。在此基础上,然后根据相似度对物种进行分支分类,对不同的分支类别设置不同选择压力系数,并利用最大似然法对模型的参数进行了估计,通过具体数据集计算出物种各分枝的不同选择压力系数,最后将新模型与原模型进行了比较。第四章主要讨论了EM算法对存在插入、缺损的观测序列构建系统发生树的参数估计问题,重点在于应用EM算法在简单密码子置换模型JC69和K80下,对含不完整数据的序列伽马距离进行参数估计,并介绍了检验系统发生树可靠性的方法。关键词:密码子置换模型,密码子使用偏性,氨基酸生化距离,EM算法,系统发生树I基于密码子偏性和分支聚类的密码子置换模型的统计推

6、断AbstractBioinformaticsisoneofthemostpopularfieldsofmultiplesubjects,whichinvolvesbiology,mathematics,computerscienceandtherelatedsubjects.Phylogeneticanalysis,asoneofimportantresearchcontentsofbioinformatics,makestheinferencesandevaluationofbiologicalevolutionalrelationshipsbyusi

7、ngtheprobabilisticandstatisticalmethodsandbiomoleculardata.Thecomputationalmolecularevolutionbasedonphylogeneticshasbeenwidelyappliedinthefieldsofevolutionarygenetics,ecologyandgenomicscienceandsomebiologicalexperimentsciencessuchasvirologyanddevelopmentalbiology.Theestablishmento

8、fprobabilisticsubstitutionmodelsb

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。