基于从头算法的转座子识别方法研究

基于从头算法的转座子识别方法研究

ID:37391369

大小:9.39 MB

页数:57页

时间:2019-05-23

基于从头算法的转座子识别方法研究_第1页
基于从头算法的转座子识别方法研究_第2页
基于从头算法的转座子识别方法研究_第3页
基于从头算法的转座子识别方法研究_第4页
基于从头算法的转座子识别方法研究_第5页
资源描述:

《基于从头算法的转座子识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号R857.3密级公开重庆邮电大学硕士学位论文论文题目基于从头算法的转座子识别方法研究英文题目StudyofDenovoTEidentificationalgorithm硕士研究指导教师学科专业计算机技术论文提交日期2Q!圣生量旦2垒旦论文答辩日期2壁!圣主量旦至鱼璺论文评阅人2013年5月26日独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得重废由g电太堂或其他教育机构的学位或证书而使用过的材料。与我一同工

2、作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:嘞签字日期:洲弓年S月珥扫学位论文版权使用授权书本学位论文作者完全了解重庆邮电太堂有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权重庞邮电太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:惭佩新躲釉签字日期:ⅥB年岁月V怕签字日期:多∽多年r月冲日重庆邮电大学硕士论文摘要转座子(Tran

3、sposableElements,TE)是可移动的、重复的基因序列,它们在真核基因组中几乎无所不在,并对基因组的结构、功能和进化起到了十分重要的作用。目前,对转座子的研究已经非常深入,从转座子的鉴定和注释,再到对其详细的分类都有了相应的成熟软件或分析工具。论文首先总结和分析比较了各种主要的关于转座子的相关软件方法,通过各个方法的比较,我们知道Denovo(从头)算法虽然在其得到的转座子家族序列在以后的研究中需要进一步的修正,但它却是在鉴定、注释新基因组中转座子所必要的一步,也通常是全面处理的第一步,其结果对之后的研究中更是能产生深远的影响,但在得到的转

4、座子家族序列以后的研究中尚需要进一步的修正,由此我们对其从头算法进行了改进。本研究主要改进的是基于从头算法中的Repeatscout软件,它主要用于发现新的、未注释的转座子家族,对于高频出现的转座子的鉴别尤其有效。其主要优点则是不用与己知的数据库相比较,而主要的缺点是运行时间较长。首先提出了改进的理论依据并阐述了原算法的实现过程,在实现过程中主要是考虑了数据的冗余现象,不仅包括在得到转座子家族的多序列比对中的整体的遍历计算,也考虑了在“隐藏”序列过程中的双序列比对的遍历过程,通过分析其转座子数据的特征性,我们归纳其特征实现了以上两种去除数据的冗余的方法

5、。再者,我们考虑到其碱基序列的本身只要4种情况,而这个改进可以在理论上真正做到无误差的去除冗余情况。研究结果表明,在整个算法的实现中,我们总结出了其转座子家族得到的过程可分为四个步骤:(1)从序列中计算得到k.met种子,并给出每个k.met种子详细“注释”;(2)依据不同的标准来选取一个k.met种子;(3)通过选取的k.met种子进行多序列比对来得到转座子家族,再通过双序列比对来在序列中来“隐藏”出现过的k.met种子及其序列;(4)调整k.met种子频率及其他注释再次来选取一个种子。本研究中,我们不仅对选取k.met种子的标准进行了一定的改进,使

6、其在选取种子的标准更加的严谨,这也是本文中对此算法的创新点所在,而且在考虑的造成运行时间长的三种去除冗余的方法方面,最后通过结果比对,包括其精度的比较和运行时间的比较,在一致的选取K.met种子标准下,我们改进之后的算法结果在其精度未损失的情况下,其运行时间也得到了一定的减少。重庆邮电大学硕士论文摘要关键字:转座子,识别方法,注释,隐马尔科夫模型,从头开始算法,基于同源性,基于结构特征II重庆邮电大学硕士论文AbstractAbstractTransposableElements(TE)aremobileandrepetitivegeneticDNAs

7、equence,whicharepresentinnearlyallgenomesandaffectthestructure,functionandevolutionofgenomesinalargescale.TheyaredeeplystudiedandmanyalgorithmsandtoolsaredevelopedtoidentifyandannotateTEs.Here,wefirstsummarizeandclassifythemethodstoidentifyTEs,bythecomparionofallmethods,weknowth

8、attheTEfamiliessequencesresultsofDenovoalgorith

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。