欢迎来到天天文库
浏览记录
ID:35056810
大小:4.15 MB
页数:83页
时间:2019-03-17
《基于gpu的大豆基因数据分析方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、'■.i//.'/'^未乂;:芒:::::v奇V.纖.五.令^…......囉I■..7i,i"硕壬研究生学位论文截J‘.f^基于-GPU的大豆基因数据分析方法的研究f!.11、..狂.''、、幸#户串请人■-:诱金亮;v%C,歲:,■■学号:21313551%,.。,培养单位-7;来:计算化科学与技术学晓y护!-■..V.餓专业:软件工程/,職站.:严巧巧方向计算生物学,产..,V,———、-''指导陆军教授.,.‘.'…'
2、\■:咕屯边a^完成日期:2016年5月28日\'i\、\''.,、.-‘-I//:-''-‘.T,V:.,S,1诚/‘.'.'.卢..’-/''.%'占.叩〇u..‘.....巧獅/V'iK‘沪矿勺'一'';.X卢',:麵(夏,ii独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加标注和致谢的地方外,论文中不包含其他人己经发表或撰写过的研究成果,也不包含为获得黒龙江大学或其他教育机构的
3、学位或证书而使用过的材料。学位论文作者签名签字曰期:文〇年月曰/(^^学位论文版权使用授权书本人完全了解黑龙江大学有关保留、使用学位论文的规定,同意学校保留并向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人可授权黒龙江大学可W将学位论文的全部或部分内容编入有关数据库进行检索,W采用影印、缩印或其他复制手段保存、汇编本学位论文。学位论文作者签名导师签名:签字日期:2〇li年^月曰签字曰期;之〇/^年^月^曰《学工位论文作者毕业后去向:通讯作地单位:电话:址:邮编:分类号UDC密级公开硕士研究
4、生学位论文基于GPU的大豆基因数据分析方法的研究申请人:郑金亮学号:2131355培养单位:计算机科学与技术学院学科专业:软件工程研究方向:计算生物学指导教师:陆军教授完成日期:2016年5月28日中文摘要随着生物领域高通量测序技术的出现,海量生物数据不断涌现,但是不完美的算法以及数据量的制约使得生物信息处理效率依然不高,因此,优化算法以及采用并行手段进一步提升数据处理效率显得十分必要。本文以大豆基因数据作为研究对象,对大豆基因编码区和非编码区的数据处理方法进行了优化和并行处理。主要的工作内容包括:首先,本文对大豆基因非编码区的启动子数据处理过程进行研究,对其中涉及的调控元
5、件定位算法进行了优化,针对算法中存在冗余匹配问题,提出了基于反向匹配的调控元件定位算法,并对启动子数据中存在代表重复序列的连续字符N进行了特殊处理,采用跳跃式处理方法进行优化。其次,在对串行算法优化的基础上,本文采用GPU并行技术对大豆启动子数据处理过程进行多种并行方式的实现。单GPU并行方面,讨论了并行线程设置原则,实现了一级并行和两级并行。在多GPU并行方面,规划各GPU任务安排,实现了多GPU并行,并从访存方面进行了优化。最终,经过优化、并行处理后的大豆启动子数据处理效率提高了两个数量级。第三,本文对编码区的基因表达数据生成关联规则过程进行并行研究,分析了基因表达数据
6、的特点,提出二进制位组合方式的非递归生成关联规则算法,并进行了GPU并行,新算法突破了递归算法GPU并行时的局限。最后对实验结果进行了分析,指出了算法的优势和存在的问题。关键词:GPU并行;大豆启动子;调控元件识别;基因关联分析-I-AbstractWiththeemergenceofhigh-throughputsequencingtechnology,hugeamountsofbiologicaldataareemerging.Butimperfectalgorithmandlimitsofdatasizemakebiologicaldataprocessingeffi
7、ciencyisnothigh.Soitisverynecessarytofurtherimprovetheefficiencyofdataprocessingbyoptimizingalgorithmandusingtheparallelmethod.TakingGlycinemaxgenedataasresearchobjectinthispaper,thedataprocessingmethodofcodingandnon-codingregionsinGlycinemaxgeneareoptimizedan
此文档下载收益归作者所有