硫肽生物合成基因簇及细菌非编码rna的挖掘与分析

硫肽生物合成基因簇及细菌非编码rna的挖掘与分析

ID:33157524

大小:2.64 MB

页数:81页

时间:2019-02-21

硫肽生物合成基因簇及细菌非编码rna的挖掘与分析_第1页
硫肽生物合成基因簇及细菌非编码rna的挖掘与分析_第2页
硫肽生物合成基因簇及细菌非编码rna的挖掘与分析_第3页
硫肽生物合成基因簇及细菌非编码rna的挖掘与分析_第4页
硫肽生物合成基因簇及细菌非编码rna的挖掘与分析_第5页
资源描述:

《硫肽生物合成基因簇及细菌非编码rna的挖掘与分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、申请上海交通大学硕士学位论文硫肽生物合成基因簇及细菌非编码RNA的挖掘与分析研究生:李静导师:欧竑宇教授学科专业:生物学所在院系:生命科学技术学院上海交通大学二零一三年一月万方数据DissertationSubmittedtoShanghaiJiaoTongUniversityfortheDegreeofMasterGENOMICMININGANDINSILICOANALYSISOFTHIOPEPTIDEGENECLUSTERANDNON-CODINGRNAOFBACTERIAAuthor:JingLISupervisor:Prof.Hong-YuO

2、USepcialty:BiologyDepartment:SchoolofLifeSciencesandBiotechnologyShanghaiJiaoTongUniversityJanuary,2013万方数据万方数据万方数据上海交通大学硕士学位论文硫肽生物合成基因簇及细菌非编码RNA的挖掘与分析摘要随着DNA测序技术的进步,迄今为止已有近两千原核生物基因组被全测序,而二代测序技术的广泛应用更是推进了细菌转录组的研究。面对海量组学数据的剧增,急需大规模深度挖掘这些重要微生物资源。本论文以细菌硫肽生物合成基因簇预测和细菌非编码RNA序列特征分析等两

3、个重要问题为切入点,深入探讨利用生物信息学进行生物大数据挖掘的策略。本论文第一部分是在细菌基因组序列中挖掘硫肽生物合成基因簇。硫肽(Thiopeptides)是一类被高度修饰的、富含硫的微生物源环肽类抗生素,对革兰氏阳性病原菌有很强抑制作用。近期还发现其对人癌细胞的增殖有明显抑制作用。其成员都具有一个以六元杂环为核心、由多个五元杂环和脱水氨基酸组成的典型环肽结构。为了发现新硫肽类抗生素,我们采用隐马尔科夫模型来表征硫肽合成关键酶的序列保守性,在高性能四路服务器上采用LAMP架构开发了识别硫肽合成基因簇的在线工具ThioFinder。该工具可在2-3分

4、钟内快速地识别出BacilluscereusATCC14579基因组(5.4M)中完整的thiocillin合成基因簇及其前体肽的剪切位点。从NCBI收录的1686个全测序和1875个部分测序的菌株基因组序列中,ThioFinder识别出65个硫肽基因簇;其中11个与已得到实验报道的完全一致,其余的54个是首次报道。此外,内置的基于PostgreSQL的开放数据库ThioBase首次I万方数据上海交通大学硕士学位论文系统地收录了99个已知硫肽化合物的化学结构、生物活性和产生菌等重要信息,可供硫肽抗生素研究者对相关化合物信息进行快速查找与比较。Thio

5、Finder提供了一个界面友好和快速高效识别硫肽合成基因簇的网上工具,有助于更多新的硫肽类抗生素的发现,同时对于研究者应用组合生物合成技术开发新的临床药物提供新的思路。ncRNA是一类长度在几十至几百个核苷酸之间的RNA分子,不编码蛋白质。在不同环境下,细菌ncRNA对宿主基因表达调控有关键作用,从而可能对细菌致病和耐药等重要生理过程产生影响。本论文第二部分即结合当前RNA-Seq技术在细菌转录组学中的应用,系统地收集和分析了RNA-Seq实验产生的ncRNA数据。通过对17个细菌RNA-Seq实验进行分析,获得了17个物种中的1490个ncRNA基

6、因。此外,通过大量文献挖掘,获得了878个实验验证的ncRNA基因。整合实验验证和RNA-Seq两个不同来源的ncRNA,将其作为阳性数据集。对这些ncRNA基因的转录起始和终止区域信号特征进行分析,发现了ncRNA基因的转录单元特征与细菌基因组的G+C含量紧密相关,从而为不同种属细菌ncRNA的准确预测提供了数据基础。关键词:硫肽生物合成,细菌非编码RNA,细菌基因组学,生物信息学在线工具,分子生物学数据库II万方数据上海交通大学硕士学位论文GENOMICMININGANDINSILICOANALYSISOFTHIOPEPTIDEGENECLUST

7、ERANDNON-CODINGRNAOFBACTERIAABSTRACTTheDNAsequencingtechnologyisdramaticallyadvancing,whichhasmeasuredthecompletegenomesequencesofnearly2000prokaryotes,andespeciallythewidelyusednext-generationsequencing(NGS)technologyisalsopromotingbacterialtranscriptomicstudies.However,thegro

8、wingmassive-scaleomicsdatacallurgentlyforrapidanddeepm

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。