欢迎来到天天文库
浏览记录
ID:34711771
大小:2.11 MB
页数:59页
时间:2019-03-09
《新一代测序数据的快速可视化方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文新一代测序数据的快速可视化方法研究RESEARCHONMETHODOFTHENEXTGENERATIONSEQUENCINGDATAVISUALIZATION韩超哈尔滨工业大学2016年12月万方数据国内图书分类号:TP39学校代码:10213国际图书分类号:004.9密级:公开工程硕士学位论文新一代测序数据的快速可视化方法研究硕士研究生:韩超导师:王亚东教授申请学位:工程硕士学科:计算机科学与技术所在单位:深圳研究生院答辩日期:2016年12月授予学位单位:哈尔滨工业大学万方数据ClassifiedIndex:TP39U.D.C:004.9Dissertationforth
2、eMasterDegreeinEngineeringRESEARCHONMETHODOFTHENEXTGENERATIONSEQUENCINGDATAVISUALIZATIONCandidate:HanChaoSupervisor:Prof.WangYadongAcademicDegreeAppliedfor:MasterDegreeinEngineeringSpeciality:ComputerScienceAndTechnologyAffiliation:ShenzhenGraduateSchoolDateofDefence:Dec.2016Degree-Conferring-Ins
3、titution:HarbinInstituteofTechnology万方数据摘要摘要随着新一代测序技术的成熟,基因组测序数据持续迅猛增长。限制当前基因组数据研究的问题已经不是如何产生数据,而是如何快速地对基因组数据进行分析。把基因组数据进行可视化处理,有利于研究人员更好、更直接地对数据进行观察,发现基因组数据间的内在联系,以及基因组数据中有可能存在的突变等问题。对基因组及其相关注释数据采用可视化的方式进行处理可以很大程度上把研究人员从枯燥繁杂的基因组数据的字符文件中释放出来,节省时间成本,更便于集中精力进行数据的分析工作。以参考基因组数据的坐标为可视化系统的坐标进行展示,较直观地呈现
4、不同序列数据之间存在的关系。现有的基因组可视化系统分为基于WEB和桌面程序两种形式,由于基于WEB的基因组可视化系统受限于网络带宽、传输速度等外在因素,影响可视化系统的速度与用户体验,本文将研究快速基因组可视化的方法,并实现基于桌面程序的基因组可视化系统,该系统小巧便捷,可以更好更快的对数据进行可视化处理,方便个人PC使用。本研究以人类基因组数据的可视化为中心展开,主要研究由变异引起的遗传信息的变化。实现了人类基因组数据、序列比对结构数据的可视化,针对基因组数据突变、反转等常见的变异类型进行可视化呈现的效果更加直观。有利于研究人员进一步研究相关疾病与药物的研制。本系统为研究人员等使用者提
5、供了选择、查找、平移以及放缩等较为丰富的交互操作,并且提出了一种基于B树的存储结构和R树的空间分割理论的针对新一代测序数据文件的索引构建方法,配合文件随机读取算法完成数据的快速读取工作,运用Bresenham画线算法更好地完成了本系统的可视化工作,对可视化响应速度和大跨度进行数据查询时的响应时间提高了近一倍。关键词:基因组;序列比对;索引构建;可视化;变异I万方数据AbstractAbstractAsthenewgenerationofsequencingtechnologymatures,genomesequencingdatasustainedrapidgrowth.Limitcur
6、rentgenomedataresearchquestionisnothowtogeneratedata,buthowtoanalyzethegenomedataquickly.Thegenomedatavisualizationprocessingishelpfulfortheresearcherscanbetterandmoredirectlytoobservethedata,andfindtheintrinsicrelationshipbetweengenomedata,andthepossibilityofmutationsandsoon.Visualprocessingonge
7、nomedataandrelatedannotationdatacanreleasedtheresearchersfromtheboringmultifariousgenomedatacharactersfiles.Soalottimecanbesaved,anditmaketheresearcherscanfocusonthedataanalysis.Thecoordinatesofthereferencegenomedatawe
此文档下载收益归作者所有