新一代高通量测序数据校正方法研究

新一代高通量测序数据校正方法研究

ID:37072528

大小:1.82 MB

页数:73页

时间:2019-05-17

新一代高通量测序数据校正方法研究_第1页
新一代高通量测序数据校正方法研究_第2页
新一代高通量测序数据校正方法研究_第3页
新一代高通量测序数据校正方法研究_第4页
新一代高通量测序数据校正方法研究_第5页
资源描述:

《新一代高通量测序数据校正方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:密级:UDC:编号:^工学硕士学位论文新一代高通量测序数据校正方法研究硕士研究生:李盛源指导教师:冯伟兴教授学科、专业:控制科学与工程论文主审人:叶秀芬教授.哈尔滨工程大学2018年03月分类号:密级:UDC:编号:工学硕士学位论文新一代高通量测序数据校正方法研究硕士研究生:李盛源指导教师:冯伟兴教授学位级别:工学硕士学科、专业:控制科学与工程所在单位:自动化学院论文提交日期:2017年12月论文答辩日期:2018年03月学位授予单位:哈尔滨工程大学ClassifiedIndex:U.D.

2、C:ADissertationfortheDegreeofM.EngResearchofNewGenerationHighthroughputSequencingDataCorrectionMethodCandidate:LiShengyuanSupervisor:FengWeixingAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ControlScienceandEngineeringDateofSubmission:Dec.2017DateofOralExaminatio

3、n:Mar.2018University:HarbinEngineeringUniversity新一代高通量测序数据校正方法研究摘要随着信息检测技术的飞速发展,高通量测序技术把生命科学研究推上了一个新的高度。目前,Illumina和IonTorrent高通量测序平台是两款主要的测序平台,Illumina是基于可逆终止的、荧光标记dNTP来边合成、边测序的,而IonTorrent则是基于半导体芯片,通过传感器将序列合成化学反应过程中的pH值变化,转化成电压信号进行测序的。IonTorrent测序平台每次测一类碱基,存在多聚碱基(连续相同碱

4、基)长度测不准的问题,而Illumina测序平台每次只测一个碱基则不存在这个问题;Illumina测序平台采用光学测序,有可能测错碱基类型,而因为IonTorrent依靠化学反应进行检测,则不会测错碱基类型。由于测序原理截然不同,两款测序仪有很强的互补性。所以根据两个测序平台的互补性,提出一种Illumina和IonTorrent两种高通量测序数据交叉校正的方法。本文设计了逻辑分析方法实现了Illumina测序数据中碱基类型错误校正和IonTorrent测序数据中多聚碱基长度错误校正。其中第一种方法依据三个原则对两个测序数据进行相互校正

5、,即Illumina测序数据的测序长度是正确的;IonTorrent测序数据的测序类型是正确的;同一位点处Illumina测序和IonTorrent测序不会同时出错。基于该原则,首先对两组测序数据进行预处理,并分析导致Illumina测序数据出错的原因;然后,比对分析总结出两种测序数据相互校正原则;最后,根据校正原则设计相互交叉校正的算法对数据进行校正。根据研究结果,因Illumina测序成本较高,还单独设计了一个基于神经网络和动态规划算法的综合模型,对IonTorrent测序数据中的多聚碱基长度错误进行直接校正。针对于该方法,首先分析

6、导致IonTorrent测序数据中多聚碱基长度检测误差的因素;然后,设计基于多层神经网络的误差校正模型;最后,为了提高识别精度,引入参考基因信息,设计多层神经网络和动态规划算法结合的综合模型,该模型可以直接对IonTorrent测序数数据直接校正。随后的实验结果表明,所提出方法能够有效校正Illumina测序数据中碱基类型错误,以及对IonTorrent测序数据中多聚碱基长度错误校正。关键词:多聚碱基;相互交叉校正算法;多层神经网络;动态规划;综合模型新一代高通量测序数据校正方法研究ABSTRACTWiththerapiddevelop

7、mentofinformationdetectiontechnology,high-throughputsequencingtechnologyhaspushedthelifescienceresearchtoanewheight.Currently,IlluminaandIonTorrenthigh-throughputsequencingplatformistwomainsequencingplatform,Illuminaisbasedonthereversibletermination,fluorescenttagsdNTPse

8、quencingbysynthesis,while,theIonTorrentisbasedonthesemiconductorchip,throughthesensorwillsequencesynthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。