欢迎来到天天文库
浏览记录
ID:33506333
大小:7.55 MB
页数:64页
时间:2019-02-26
《基于rna-seq数据的基因预测和长非编码rna鉴定的分析方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、⑧万方数据论文作者签名:指导教师签名:论文评阅人1:评阅人2:评阅人3:评阅人4:评阅人5:答辩委员会主席:委员1:委员2:委员3:委员4:委员5:答辩魄立蛆上乒一浙江大学研究生学位论文独创性声等缨幽罂炒万方数据本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得逝姿盘堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明学位论文作者签名:签字日期:≯lP年-7月扣日学位论文版权使用授权书本学位论文
2、作者完全了解盘姿盘茔有权保留并向国家有关部门或机构送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权堂望盘堂可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名签字日期:≯(1D导师签名:签字日期:训111年7“o目万方数据浙江大学硕士学位论文致谢妻差大趸萋二{凉学院万方数据浙江大学硕士学位论文摘要随着高通量测序技术的快速发展,一种新的方法一一RNA—Seq技术被广泛应用于生命科学研究。它主要是针对转录组进行定位定量分析,与之前的测序方法相比,可鉴定
3、出更多的新基因和新长非编码RNA,且预测效率明显提高。在使用RNA—Seq数据之前,需要运用FAsTx—Toolkit和TrimGalore!等质控软件对RNA—Seq初始数据进行质量检测,以提高RNA—Seq数据基因预测和长非编码RNA鉴定方法的准确性。然后,使用Tophat软件将RNA—Seq读段定位到参考基因组。基因预测是基因组注释的重要组成部分。我们以玉米和大鼠为研究对象,设计了一个四步预测分析模型。首先,通过整合EsT和RNA—Seq信息来提高基因预测的准确度。然后,利用软件AUGUSTUS预测编码蛋白质的基因,并用liftover或者Blast软件将它们与近
4、源物种的同源基因相比较,过滤掉冗余的基因。最后在玉米和大鼠组织中分别注释出202,048个和32,197个转录子,其中新基因分别为165,820个和4,802个。通过分析基因在不同组织中的表达水平,新预测方法可检测到更多低表达量的基因。长非编码RNA是生命进程调控的另一焦点。我们使用Cufflinks软件将RNA—Seq片段组装成转录子,再根据长非编码RNA的结构、功能和位置特点,使用PhyloCSF和Blast软件,辅以近缘物种的注释基因,鉴定出大量的新长非编码RNA。最后,在大鼠组织和人肺组织中分别筛选出2,761个和40,626个长非编码RNA,并分析长非编码RN
5、A在不同组织中的分布情况和表达水平.新方法可完善现有的长非编码RNA数据库。以上研究为生物学家利用基因和长非编码RNA研究复杂疾病或性状的遗传机制提供了有效的分析方法。关键词:RNA—Seq数据,Tophat软件,Cufflinks软件,基因预测,AUGUSTUS软件,长非编码RNA鉴定,PhyloCSF软件,Blast软件万方数据浙江大学硕士学位论文Abs打actAbstractW池therapiddeVelopmentofhi曲-throughputsequencingtecllnology,anew印proach,t锄edItNA—Seq(RNAsequencin
6、g),iswidelyusedinlifescienceresearches.Itismainlyaboutmapping锄dquantitatiVeanalysisof舰1scriptomea11dexhibitsobViousadV锄tagesi11obtainingalargenumberofnoVelgenesandnoVellncRNAsandiⅡ1proVillge伍ciencyofgelleprediction,comparedw池currentlyaVailablemethods.BeforeanalysisofItNA—seqdat如it’srequi
7、redtomakeuseofsomeso行Ⅳare,R~STX-TboⅡdta11dTrimGalore!,tocontr01tllequalit)rofRNA-Seqrawdat如whichcallimproVeaccumcyofgenepredictionandlncRNAsidentification.TheIl,readsarem印pedonto廿1ereferenceg锄omewitllTbphat.Genepredictionis肌indispensableprocessforgenomea衄otation.Weherepro
此文档下载收益归作者所有