欢迎来到天天文库
浏览记录
ID:35173172
大小:12.04 MB
页数:80页
时间:2019-03-20
《基于隐马尔科夫模型的外显组拷贝数异常检测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、UniversityofScienceandTechnologyofChina硕士学位论文基于隐马糸科夫模型的外显组论文题目拷贝教弄常拾测一程作者姓名生物学工程学科专业季骜到教援导师姓名二〇一五年五月完成时间肀函嗲技术大嗲硕士学位论文基于隐马尔可夫模型的外显组拷贝数异常检测作者姓名:郭程学科专业:生物医学工程导师姓名:李骜副教授完成时间:二〇一五年五月UniversityofScienceandTechnologyofChinaAdissertationformaster'sdegreeDetectionofExomeCopyNumberVariati
2、onBasedonHiddenMarkovModelAuthor'sName:::中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文是本人在导师指导下进行研宄工作所取得的成果。除己特别加以标注和致谢的地方外,论文中不包含任何他人己经发表或撰写过的研宄成果。与我一同工作的同志对本研宄所做的贡献均己在论文中作了明确的说明。作者签名:签字曰期:球“中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查
3、阅和借阅,可以将学位论文编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。公开口保密(年)作者签名:邛粒■签字日期:摘要摘要无论是在癌症还是非癌症的疾病中,拷贝数变异均扮演了重要的角色。包括全基因组测序、外显组测序、转录组测序在内的新一代测序技术的飞速发展为检测拷贝数变异带来了新的,通量实验平台与分析手段。读段深度(,是分析这些测序数据的重要信号,然而读段深度受到鸟嘌呤胞嘧啶含量、读段可定位性、分析窗口宽度等因素的严重影响,同时,外显子在基因
4、组上分布稀疏且不均匀。因此,如何利用新一代测序技术检测拷贝数变异仍是十分具有挑战性的工作。本文旨在提出并实现外显组的测序数据的分析方法:我们首先定义了相对读段深度(并探宄了该信号的统计学性质。分析结果显示,相对读段深度能较好地用经验公式描述,这为建立统计模型和优化模型参数提供了有利条件。并且,相较于原始读段深度,相对读段深度受鸟嘌呤胞嘧啶含量、读段可定位性、分析窗口宽度等因素的影响较小,因此是更为理想的信号。在相对读段深度的基础上,我们建立了隐马尔可夫模型(、并利用最大期望算法(迭代优化模型中的各项参数。最终,我们利用算法来估计各个外显子的拷贝数,从而
5、完成对拷贝数变异的检测。为了给其他的研宄者提供分析工具,我们将这一算法开发为软件。为了测试算法的性能,我们首先分析了千人基因组计划的数据,利用实验验证的拷贝数作为金标准,我们将与同类算法进行了比较,结果显示,在所有测试的算法中,具有最高的综合性能。最后,我们利用分析了三阴性乳腺癌的临床数据,并利用得到的拷贝数变异区段找出样本中可能发生异常的基因,富集分析的结果显示,这些基因与乳腺癌相关疾病显著相关。综上,无论是在正常样本或是肿瘤样本中,我们建立的模型均能较好地检测拷贝数变异和得出有生物学意义的结果。关键词:癌症拷贝数变异新一代测序外显子测序隐马尔可夫模
6、型AbstractABSTRACTCopynumbervariations(CNVs)playacrucialroleinbothcancerandnon-cancerdiseases.Thedevelopmentofnextgenerationsequencing(NGS),includingwhole-genomesequencing(WGS),whole-traascriptomesequencing(RNA-seq)andwhole-exomesequencing(WES)hasprovidedpowerfulplatformsandtechn
7、iquesforthedetectionofCNVs.Readdepthisailimportantandwidelyusedsignalinthedataanalysisofsequencingbasedexperiments.However,itisquitechallengingtodetectCNVsusingrawreaddepthduetosignaldistortioncausedbyguanine-cytosinecontent(GCcontent),,,,目录目录馳研宄背景与研宄意义本文的研宄内容献综拷贝数变异弓丨胃拷贝数变异与癌症亚
8、型拷贝数变异与癌症驱动基因拷贝数变异与非癌症疾病新一代测序技术?§新一代测序技术的原理新一代测
此文档下载收益归作者所有