原核生物基因识别程序zcurve 1.02的研发和微生物必需基因的分析

原核生物基因识别程序zcurve 1.02的研发和微生物必需基因的分析

ID:33489182

大小:1.67 MB

页数:54页

时间:2019-02-26

原核生物基因识别程序zcurve 1.02的研发和微生物必需基因的分析_第1页
原核生物基因识别程序zcurve 1.02的研发和微生物必需基因的分析_第2页
原核生物基因识别程序zcurve 1.02的研发和微生物必需基因的分析_第3页
原核生物基因识别程序zcurve 1.02的研发和微生物必需基因的分析_第4页
原核生物基因识别程序zcurve 1.02的研发和微生物必需基因的分析_第5页
资源描述:

《原核生物基因识别程序zcurve 1.02的研发和微生物必需基因的分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、⑧中国近代第一所大掌FOUNDEDIN'895。天洋大兽TI『ANd,量NUNIVERSITY论文I●夭津犬鬻霹究生院200警珲1月中文摘要随着微生物基因组计划的蓬勃发展,越来越多的微生物完成测序,迄今为止,已经有两百多种细菌和古细菌完成测序。基因组序列测定之后,找出其中的蛋白质编码基因是进行基因组分析的第一步,在生物信息学研究中占有重要的地位。本论文的主要内容是原核生物蛋白质编码基因识别以及通过序列比对的方法确定微生物的必需基因。论文的第一部分介绍了人类基因组和模式生物基因组计划,引出了生物信息学的发展背景和主要研究内容以及主要的蛋白质编码基因识别算法和基因识别领域有待

2、解决的问题。论文的第二部分介绍了DNA序列的z曲线方法,这是我们分析原核生物基因组的主要工具,同时简单介绍了z曲线方法在基因识别。基因组的isochore结构以及在细菌和古细菌复制起始位点识别等领域的应用。论文的第三部分介绍了应用z曲线方法对细菌和古细菌的基因识别。我们应用c++语言对ZCURVE1.0进行了重新编写,在训练Fisher系数方面做了一些调整,取得了和ZCURVE1.0相当的识别率,同时附加预测率有了一定的下降,用c++语言重新编写的软件被定名为ZCURVE1.02。和ZCURVE1.0相比,ZCURVE1.02程序运行速度提高了近一倍,可以在Linux和I

3、RIX等不同操作系统下运行,能够更方便的和其他软件进行整合。论文的第四部分介绍了通过序列比对的方法对微生物的必需基因进行分析。必需基因数据库(DEG)经过补充,已经包含了8个物种总共2248个必需基因,我们利用z曲线方法分析了Bacillussubtilis基因组当中必需基因和非必需基因的核苷酸分布,并且尝试通过序列比对的方法对EcoliK12基因组的必需基因进行预测,同时分析了层coliKl2基因组当中必需基因的功能分类,并且简单探讨了通过序列比对的方法确定微生物必需基因的可行性。关键词:Z曲线,细菌和古细菌基因组,基因识别,序列比对,必需基因。ABSTRACTItiS

4、uptonOWthatmorethan200bacterialandarchaealgenomeshavebeencompletedduetothequickdevelopmentofbacterialgenome—sequencingprojects.Indentificationofprotein-codinggenesinmicrobialgenomesisoneofthemostimportanttasksinbioinformafics(computionalbiology).Thispaperdescribesalittleimprovementinrecog

5、nizingprotein-codinggenesinbacterialgenomesusingtheZcurvemethodandalsotrestol/SCtheBLASTtoidentifytheessentialgenesinmicrobes.Thefirstpartofthepaperintroducesthehumanganomeproject(HGP)andmodelorganasimgenomeproject.Severalwell-knowngenerecognitionprogramsforprokaryotesandtheunsolvedproble

6、msingenerecognitionarealsoreferred.ThesecondpartofthepaperintroducestheZcurvemethodologywhichisthebasictoolinanalyzingprokaryotiegenomesandgivesabriefintroductiontotheapplicationofZcurvemethodinvariousareassuchasgenefindinginprokaryoticgenomes,isochorestructureineukaryotiegenomesandidenti

7、ficationofreplicationoriginsinthegenomeofarchaeonandbacteria.ThethirdpartofthepaperpmposestheapplicationofZcurvemethodintherecognitionofprotein-codinggenesinpmkaryoticgenomes.TheauthorimplementstheC++languagetorewritetheZCURVE1.0programandmakesatittleadjustmentintra

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。