基于Hadoop的基因组分析平台构建.pdf

基于Hadoop的基因组分析平台构建.pdf

ID:50423817

大小:7.88 MB

页数:60页

时间:2020-03-05

基于Hadoop的基因组分析平台构建.pdf_第1页
基于Hadoop的基因组分析平台构建.pdf_第2页
基于Hadoop的基因组分析平台构建.pdf_第3页
基于Hadoop的基因组分析平台构建.pdf_第4页
基于Hadoop的基因组分析平台构建.pdf_第5页
资源描述:

《基于Hadoop的基因组分析平台构建.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号TP399:F279.23学校代码10126号W1243233密级一—学心著柔畫I乂拿INNERMONGOLIAUNIVERSITY覇±拳隹论褒"。3-'MABT厦RBI浸浸展]RTATION..^H^adoop的基因组分析平台构建?'-<;**二1醒1魏J研究生:包永红指导教赋周建涛、张义广囲学校代码10126学号w1243233TP399F279分类号;.23密级工程硕±学位论文基于Hadoop的基因组分析

2、平台构建研究生:包永红指导教师:周建涛、张文广学院:计算机学院领域:软件工程20巧年11月4日原创性声明本人声明:所呈交的学位论文是本人在导师的措导下进行的巧究工作及取得的研究成果。除本文已经注明引用的巧容外,讫文中不包含其他人已经发表或撰写过的研究成果,也'不包含为获得边蒙直去堂及其他教育机构的学位或证书而使用过的材料一。与我同王作的同患对本研究所做的任何贡献巧已在论文中作了明确的说明并表示谢意。学位论文作者签冶)來紗指S教师银《:句來若日期:化4日觀如瓜i>、今

3、严rI一f-.在学期间研究成果彼用承诺书.本学位论文作者完全了解学校有关保留、使用学停接文的规定,即;内蒙古大学有权将学位论文的全部内容或部分保留并向国家有关机构、部口送交学位论文的复印件和磁盎,允许编入有关数据库进行检索,也可巧采用影印、缩印或其他复制手段保存、汇编学位论文。'为保护学院和导师的知识产权,作者在学期间取得的研究成果、(含计算机软件程序)属于内蒙古大学升算机学院。作者今后使用涉及在学期间主要研巧内容或研究成果,须征得内蒙古大学计算机学院就读期间导师的同意;若用于发表论文,版权

4、单位必须署名为内蒙古大学计算化学院方可投稿或公开发表。^学位论文僻齡:奴朵勤指导教师齡:^化去f、、日期:2、1、}日期:Toir化I内蒙古大学工程硕壬学位论文基于Hadoop的基因组分析平台构建摘要高通量测序技术的发展带给生物信息学处理的数据越来越多,如何从海量的实验数据中挖掘出有价值的知识和规律成为生物信息学研究的热点。5计算是网格、并行、分布式计算、发展的新结果,人们可W通过网络获取云端提供的计算存储能力及基础设施。云计算平台可W有效存储、处理和分析海量生物信息数据。本文主要

5、研究了云计算开源平台Hadoop及其Hadoop平台下开源生物信息存储和处理工具的基础上做了如下工作:1.Hadoop基础平台的构建与研究研究了HadoopCommon、Hadoop分布式文件系统和MapReduce分布式计算框架。在Docker虚拟容器中构建了Hadoop集群及基因组分析平台,掌握了构建可伸缩、经济效率高、可靠的云计算基础设施的方法。2.基因组关联分析平台的构建(1)构建了核巧酸序列数据库。经过资源整合和标准化,创建了结合Hadoop分布式文件系统和MySql数据库相结合的反与动

6、物基因组信息资源库。(2)整合了基于Hadoop的基因组分析工具。在基因组分析中常见的应用有基因组序列组装、序列比对、基因组关联分析和序列表达分析等,结合开源的云升算生物技术工具Co一ntrail、Clou加urst、Mrna并通过封装Hadoo平台统的作业运行和监控模型。y,建立了在p(3)Web应用界面开发。利用Java及JavaWeb开发技术,结合用户对基因组分析功能需求,将核酸序列数据库及整合的基因组工具封装成为简单、易用、透明的Web服务,为用户提供序列提交、查询、基因组比较和关联分析等功能的Web

7、平台。I基于Hadoo的反当家畜基因组分析平台的构建p关键词:云计算,Hadoop,生物信息学II内蒙古大学工程硕±学位论文Cons化UC材onofenomeanalsislatformbasedonHadoogyppABSTRACTWi化theraiddevelomentofhighthroughutseuencintechnologyaswellasthepppqg,increasinrocesseddataofBioinformaticsmin

8、invaluableknowledeandatternsamonmassgp,ggpgexperimentaldatahasbecomeresearchhotspotint

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。