基因组中重复序列识别与分析

基因组中重复序列识别与分析

ID:32468874

大小:1.79 MB

页数:51页

时间:2019-02-06

基因组中重复序列识别与分析_第1页
基因组中重复序列识别与分析_第2页
基因组中重复序列识别与分析_第3页
基因组中重复序列识别与分析_第4页
基因组中重复序列识别与分析_第5页
资源描述:

《基因组中重复序列识别与分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国防科学技术大学研究生院学位论文摘要重复序列在基因组中广泛存在,按照重复单元的排列方式,可将它分为串联重复序列和散在重复序列两大类。串联重复序列就是重复单元首尾相连,串接在一起的重复序列。串联重复在基因表达、调控和遗传等方面起着十分重要的作用,同时它因具有高度多态性,己成为基因组遗传图谱和物理图谱的理想界标,另外以串联重复为基础的“DNA指纹技术”在法医学等领域广泛应用。更引人注目的是,近年来发现有许多遗传疾病与三核甘酸重复的周期异常有关。因此关于串联重复的研究具有十分重要的理论意义和应用价值。然而要在基因组范围内系统地分析串联重复序列,离不开广泛的算法支持,尤其是串联重复识别算法。串联重

2、复识别算法是开展重复序列分析的基础。因此本文主要研究串联重复序列识别算法,并提出了一种新的精确串联重复识别算法,该算法基于一种新的数据类型——后缀列和最大公共前缀列,无需任何先验知识,就可以在基因组范围内快速准确地识别出所有满足给定条件的精确串联重复序列。在此精确串联重复识别算法的基础上,把精确串联重复作为核,通过回绕动态规划比对将精确串联重复和它所在的序列片段进行比对,使精确串联重复序列扩展为具有插入、删除和错配结构的有效模糊串联重复。这就得到了模糊串联重复识别算法。以上述算法为基础,本文实现了一个可以快速有效地识别出基因组中所有满足给定条件的串联重复序列的应用程序RepLocate。为

3、了说明算法的效率和作用,本文还将它应用于4组实际的基因组DNA序列,并且给出了实验结果,以及运行时间。关键词:基因组,重复序列,串联重复序列,模糊串联重复序列,后缀列,最大公共前缀列,串联重复序列识别算法第一I.页国防科学技术大学研究生院学位论文AbstractRepetitivesequencesmakeupasigIliflc趾t丘actionofgenomes.Accordingtomewaytheyarearranged,repetitivesequencescallbegenerallyclassmedintot、vola唱egroups:taIldemr印eata11ddisp

4、ersedrepeat.TaJldemr印eatisakmdofr印eatwhichconsistsoftwoormoreconti硼ouscopies.ThdemrepcatsplayaV撕etyofrolesmgeneexpression,regulationa11deVolution,趾dareidealmarkeringenedcmapping.Furthermore,thetec}uliqeofDNAfingerprintingbascdon也epolymoIpllismoftandemr印eatisnow晰delyusedinvariousfieldssuchasnledica

5、ljurispnldence,etc.Themoreeyc—catcllingdiscover)ris,inrecentyears,t上1atsomegeneticdiseasesarerelated谢thcerta协trinucleoddercpeats.Thus,thercsearchontandemrepeatsisofgreattheoreticalandpmcticalimponance.However,mesystematic柚alysisoftandemrepeatsiIlgenomicraIlgeisralliedtoextensiVealgorithIllicsuppor

6、ts,especiallymealgoriⅡlmforlocatingt趾demrepeats.Algorithmfor10catingta】帕emrepeatsisthebaSeforrepeataIlalysis.Therefore,也emainresearchtaskof血isthesisisabout也ealgoritllmforlocatingtandemrepeats.Anewalgorithmforlocatingexacttandemrepeatsispesented.Tllisnewalg耐thm,wllichisbasedonan删dadas虹uctllrrsu硒xam

7、ayandLCPa“ay,caIllocatcall也eexacttaIldemrepeatsinmegenome,研tI】outanypriorkⅡowledge.AfterlocatingmeexacttaIldeInr印eats,weuset11锄asseedsandexpandtllembywraparounddyn锄icaliglling,andf-mallygetallmevalidappro)【imatet

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。