欢迎来到天天文库
浏览记录
ID:33489182
大小:1.67 MB
页数:54页
时间:2019-02-26
《原核生物基因识别程序zcurve 1.02的研发和微生物必需基因的分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、⑧中国近代第一所大掌FOUNDEDIN'895。天洋大兽TI『ANd,量NUNIVERSITY论文I●夭津犬鬻霹究生院200警珲1月中文摘要随着微生物基因组计划的蓬勃发展,越来越多的微生物完成测序,迄今为止,已经有两百多种细菌和古细菌完成测序。基因组序列测定之后,找出其中的蛋白质编码基因是进行基因组分析的第一步,在生物信息学研究中占有重要的地位。本论文的主要内容是原核生物蛋白质编码基因识别以及通过序列比对的方法确定微生物的必需基因。论文的第一部分介绍了人类基因组和模式生物基因组计划,引出了生物信息学的发展背景和主要研究内容以及主要的蛋白质编码基因识别算法和基因识别领域有待
2、解决的问题。论文的第二部分介绍了DNA序列的z曲线方法,这是我们分析原核生物基因组的主要工具,同时简单介绍了z曲线方法在基因识别。基因组的isochore结构以及在细菌和古细菌复制起始位点识别等领域的应用。论文的第三部分介绍了应用z曲线方法对细菌和古细菌的基因识别。我们应用c++语言对ZCURVE1.0进行了重新编写,在训练Fisher系数方面做了一些调整,取得了和ZCURVE1.0相当的识别率,同时附加预测率有了一定的下降,用c++语言重新编写的软件被定名为ZCURVE1.02。和ZCURVE1.0相比,ZCURVE1.02程序运行速度提高了近一倍,可以在Linux和I
3、RIX等不同操作系统下运行,能够更方便的和其他软件进行整合。论文的第四部分介绍了通过序列比对的方法对微生物的必需基因进行分析。必需基因数据库(DEG)经过补充,已经包含了8个物种总共2248个必需基因,我们利用z曲线方法分析了Bacillussubtilis基因组当中必需基因和非必需基因的核苷酸分布,并且尝试通过序列比对的方法对EcoliK12基因组的必需基因进行预测,同时分析了层coliKl2基因组当中必需基因的功能分类,并且简单探讨了通过序列比对的方法确定微生物必需基因的可行性。关键词:Z曲线,细菌和古细菌基因组,基因识别,序列比对,必需基因。ABSTRACTItiS
4、uptonOWthatmorethan200bacterialandarchaealgenomeshavebeencompletedduetothequickdevelopmentofbacterialgenome—sequencingprojects.Indentificationofprotein-codinggenesinmicrobialgenomesisoneofthemostimportanttasksinbioinformafics(computionalbiology).Thispaperdescribesalittleimprovementinrecog
5、nizingprotein-codinggenesinbacterialgenomesusingtheZcurvemethodandalsotrestol/SCtheBLASTtoidentifytheessentialgenesinmicrobes.Thefirstpartofthepaperintroducesthehumanganomeproject(HGP)andmodelorganasimgenomeproject.Severalwell-knowngenerecognitionprogramsforprokaryotesandtheunsolvedproble
6、msingenerecognitionarealsoreferred.ThesecondpartofthepaperintroducestheZcurvemethodologywhichisthebasictoolinanalyzingprokaryotiegenomesandgivesabriefintroductiontotheapplicationofZcurvemethodinvariousareassuchasgenefindinginprokaryoticgenomes,isochorestructureineukaryotiegenomesandidenti
7、ficationofreplicationoriginsinthegenomeofarchaeonandbacteria.ThethirdpartofthepaperpmposestheapplicationofZcurvemethodintherecognitionofprotein-codinggenesinpmkaryoticgenomes.TheauthorimplementstheC++languagetorewritetheZCURVE1.0programandmakesatittleadjustmentintra
此文档下载收益归作者所有