资源描述:
《通过RNASeq估计转录本长度和辨识剪切异构体的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、清华大学综合论文训练题目:通过RNA-Seq估计转录本长度和辨识剪切异构体的研究系别:自动化系专业:自动化姓名:李天阳指导教师:张学工教授辅导教师:江瑞副教授2013年7月1日关于学位论文使用授权的说明本人完全了解清华大学有关保留、使用学位论文的规定,即:学校有权保留学位论文的复印件,允许该论文被查阅和借阅;学校可以公布该论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存该论文。(涉密的学位论文在解密后应遵守此规定)签名:导师签名:日期:中文摘要RNA-Seq是最近几年发展起来的通过高通量测序对转录组中的序列进行测
2、序的一种技术。RNA-Seq技术的发展使得人们在最近几年中对于生物中的基因表达的规律,以及基因组上的功能模块有了更为深入的了解。在通过RNA-Seq数据确定基因的表达量时,我们需要知道基因序列的长度。但是在没有基因注释或者没有基因组参考序列时,我们需要一种得知基因的长度的方法。本文提出了一个通过RNA-Seq数据对转录本的长度进行估计的统计方法。通过该方法,我们可以在基因组参考序列没有基因注释信息,以及没有基因组参考序列,的情况下使用RNA-Seq数据估计出转录本的长度。同时,在RNA-Seq数据中我们发现读段的分布位置不
3、均匀。此处我们对RNA-Seq数据中读段分布的不均匀性做了初步的分析。此外,真核生物的基因在有多个外显子的情况下会有选择性剪切的现象发生,同一个基因可能会产生多个剪切异构体。通过RNA-Seq数据我们可以辨别一个基因的不同的剪切异构体。本文证明了用最大似然的方法通过真核生物RNA-Seq数据辨识基因的剪切异构体是一个NP难问题。关键词:RNA-Seq;转录组;转录本IABSTRACTRNA-Seqisatechnologydevelopedinthelastfewyearsforsequencingthetran-scri
4、ptomeusinghighthroughputsequencing.UsingRNA-Seq,peoplehavegainedmuchdeeperunderstandingofgeneexpressionpatterns,andfunctionalmodulesingenomes.Whenestimatingatranscript’sexpressionlevelwithRNA-Seq,weneedtoknowthelengthofthetranscript’ssequence.However,whennoannotat
5、ionsorrefer-encegenomesequencesareavailable,weneedanothermethodtoknowthetranscript’slength.Here,wepresentastatisticalmethodtoestimatetranscriptlengthusingRNA-Seq.Usingthismethod,wecanestimateatranscript’slengthwhennoannotationsareavailableforthereferencegenomesequ
6、ences,orwhenthereferencegenomese-quencesarenotavailable.WealsoobservedthatRNA-Seqreadsarenon-uniformlydistributed.Here,wepresentapreliminaryanalysisonthenon-uniformdistributionofRNA-Seqreads.Furthermore,aneukaryoticgenewithmultipleexonscancorrespondtomultipleisofo
7、rmsduetoalternativesplicing.RNA-Seqenablesustodetermineagene’sisoromswithRNA-Seqdata.Here,weprovethatusingeukaryoticRNA-Seqdatatoidentifyagene’sisoformsbymaximumlikelihoodisNP-hard.Keywords:RNA-Seq;transcriptome;transcriptII目录第1章引言.................................
8、...........................................11.1RNA-Seq..........................................................................11.2RNA-Seq数据分析方法简介.....