欢迎来到天天文库
浏览记录
ID:35106544
大小:7.45 MB
页数:78页
时间:2019-03-18
《基于高通量转录组测序的序列比对算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、木留钟達若来大赛UniversitofScienceandTechnoloofChinaygy硕±学位论文...\\.戀基于高通量转录组側序论文题目的序列比对算法研堯张勇作者姓名计鼻柄软件与理冶学辛斗专业徐去敎换导师姓名二-六年十月十王〇g完成时间中通种《接禾乂嗦硕±学位论文基于高通量转录纽测序的序列比对算法研究作者姓名:张勇学科专业:计算机软件与理论导师姓名:徐云教授二0—完成时间:六年十月十H日UniversityofSc
2、ienceandTechnologyofChina’ADisseilationforMastersDereeg參ResearchonSequenceAlinmentAlgorithmBasedong-HighthroughputTranscriptomeSequencingA’u化orsName:YonZhanggSecialit:ComuterSoftwareandTheorpypySuervisor:Prof.YunXup出Finishedtime:O
3、ctober132016,中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进巧研巧工作所取得的成果。除己特别加W标注和致谢的地方外,论文中不包含任何他人己经发表或撰写过的研究成果一。与我同工作的同志对本研巧所做的贡献均己在论文中作了明确的说明。之狐/汉王作者签名::—亂签字日期7中国科学技术大学学位论文授权使用声明?作为申请学位的条件之,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家巧关部口或机构送巧L论文的复印件和化子版,允
4、许论文被查阅和借阅,可:A将学位论文编入《中国学,可W采用影印位论文全文数据库》等有关数据库进行检索、缩印或扫描等复制一致手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相。保密的学位论文在解密后也遵守此规定。公开□保密(年)作者签名:J&M导师签名:王签字日期.7:20///化文7签字日期:摘要摘要一近些年,下代测序技术获得了突飞猛进的发展,由此产生了越来越多的测序数据一直W来都是生物信息学领域的一项重要研究内。如何处理这些测试数据一容,下代测序技术应用到转录组研巧领域产
5、生了高通量转录组测序技术,简称一-RNA-S技术项重要功能便是重构剪接之前的为巧。RNAseq数据分析软件的mRNA在细胞中的形态,此外,还应该能够评估每种剪接异构体的表达水平。但^-是,所有分析过程的第步都是要把从RNAseq中得到的测序片段比对到相应的参考序列上,所。因为内含子序列在DNA转录为成熟mRNA时会被剪切除去,W与传统的序列比对问题相比,转录组序列比对有其固有的特殊之处即需要将-测序得到的序列分段比对到不同的外显子序列上,因此需要设计专口针对RNA-se的序列比对算法。现有的RNAS巧序列比对算法基本上都
6、是依赖于经典的剪qGT-接位点信号,而许多非经典的剪接信号位点具有重要的生物学功能,如TGGa-与人类腺昔酸环化酶刺激蛋白s的形成有关。为此,我们设计了两个新的RNAse序列比对算法,用来发现多种类型的剪接位点q。(])独立于剪接位点信号的转录组序列比对算法^-首先我们设计了种采用重叠种子内部扩展策略的RNAseq序列比对算法,命名为RNAMap。种子序列的重叠性能够保证由种子的比对信息能够组合出完整测序序列的定位信息一一个动态。在扫描基因组时,RNAMap建立个静志表和,此时并不表来索引种子序列及其比对信息,
7、寻找左右错点序列之间的剪接位点受经典剪接位点信号的限制,对于。实验结果表明含有多种类型的剪接位点的数.%和9.01%,优于其它的转据集,RNAMap的召回率和精确度分别这到了92537录组序列比对工具。(2)转录组序列比对算法改进^之后我们又讶计了种采用非重叠种子之间扩展策略的RNA-se序列比对q算法,命名为RNAMap2。该算法通过减少种子的数量来降低计算量,然后利用^测序深度,即测序序列的重复性来进行比对a。这在定程度上弥补了RNAMp在运行速度方面的不足,300b,RNAMa。实验结果表明在测序序列的长度为p
8、时p2-2a近40%。此外eedlemanWunsch全局比RNAMp快将,民NAMap采用N动态,规划算法,能够
此文档下载收益归作者所有