基于sector%2fsphere云计算平台的海量gc-ms数据并行处理算法研究与实现

基于sector%2fsphere云计算平台的海量gc-ms数据并行处理算法研究与实现

ID:26865353

大小:4.49 MB

页数:87页

时间:2018-11-29

基于sector%2fsphere云计算平台的海量gc-ms数据并行处理算法研究与实现_第1页
基于sector%2fsphere云计算平台的海量gc-ms数据并行处理算法研究与实现_第2页
基于sector%2fsphere云计算平台的海量gc-ms数据并行处理算法研究与实现_第3页
基于sector%2fsphere云计算平台的海量gc-ms数据并行处理算法研究与实现_第4页
基于sector%2fsphere云计算平台的海量gc-ms数据并行处理算法研究与实现_第5页
资源描述:

《基于sector%2fsphere云计算平台的海量gc-ms数据并行处理算法研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级UDC学号桂林电子科技大学工程硕士学位论文题(中英文)目基于Sector/Sphere云计算平台的海量GC-MS数据并行处理算法研究与实现ResearchandimplementationofparallelalgorithmforprocessingmassiveGC-MSdatabasedonSector/Sphere作者姓名:任洪军学校指导教师姓名职务杨辉华(教授)工程领域:计算机技术企业指导教师姓名职务蒋泰(教授)提交论文日期:2012-09-23独创性(或创新性)声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文

2、中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得桂林电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:日期:关于论文使用授权的说明本人完全了解桂林电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属桂林电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为桂林电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论

3、文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密的论文在解密后遵守此规定)本学位论文属于保密在____年解密后适用本授权书。本人签名:日期:导师签名:日期:摘要摘要气相色谱质谱联用技术(GasChromatography-MassSpectrometry,简称GC-MS)因具有分辨率高、灵敏度高、重现性好,价格相对较低等优点,被广泛的应用于生物代谢研究、生物标志物的发现、毒理学、营养学、农业病理学等领域。气相色谱质谱联用所获得的色谱图可包含几万张质谱图,其数据量大且格式复杂,数据处理涉及去噪平滑、基线校正、峰提取、重叠峰解析、保留时间

4、对齐、化合物定量分析等,整个计算过程极其耗时。目前国内GC-MS数据处理算法及软件的研究处于刚刚起步阶段,国外GC-MS数据处理软件主要针对少量样本的处理,而对于大批量样本的处理算法及软件仍是空白。当处理大量数据时过长的处理时间会严重拖延整个实验进度,计算机内存不足也成为处理大批量样本的瓶颈,针对这个问题,提出了基于云计算平台Sector/Sphere的GC-MS数据并行处理方案,主要工作如下:(1)针对GC-MS大批量样本处理的速度慢,单机内存不足的问题,结合云计算平台Sector/Sphere的高速性、灵活性等优势,设计了基于Sector/Sphere平台的GC-MS数据

5、并行处理框架,为GC-MS数据处理并行算法的研究与实现提供依据。(2)提出了依据层次聚类的样本集自动分组原理,提出以各样本簇的平均样本作为对齐依据的簇结果合并算法,设计并实现了多样本对齐并行处理流程,实验验证了多样本并行对齐算法的准确性和有效性,能够在保证较高正确率的前提下加快数据处理速度,同时解决单机内存不足的问题。(3)提出了两种多样本联合定量思路,提出了多样本定量离子选择算法,设计并实现了多样本联合定量并行处理流程,实验验证了多样本联合定量并行算法的有效性以及准确性,并行算法具有较高的加速比。(4)针对现有GC-MS数据处理软件处理大批量样本的能力不足问题,设计并实现了

6、基于Sector/Sphere平台的GC-MS数据并行处理软件,为其它质谱数据处理流程的并行化提供了科学依据。关键词:GC-MS并行处理框架;多样本对齐;多样本联合定量;Sector/Sphere;云计算-I-AbstractAbstractGaschromatography-Massspectrometry(GC-MS)isoneofthemostextensive appliedtechnologyinthefieldofmetabolomics,biomarkerdiscovery,toxicology, nutriologyandagriculturehistopat

7、hology,duetoitsadvantages,whichincludinghigh resolution,highsensitivity,goodreproducibilityandrelativelylowprice.ThechromatographyderivedbyGC-MScaninvolvethousandsofmassspectrums whichleadstomassofdatawithcomplicatedformat.ThedataanalysisofGC-MStouches o

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。