国家农作物种质资源数据库数据挖掘平台-研究

国家农作物种质资源数据库数据挖掘平台-研究

ID:33380025

大小:1.57 MB

页数:43页

时间:2019-02-25

国家农作物种质资源数据库数据挖掘平台-研究_第1页
国家农作物种质资源数据库数据挖掘平台-研究_第2页
国家农作物种质资源数据库数据挖掘平台-研究_第3页
国家农作物种质资源数据库数据挖掘平台-研究_第4页
国家农作物种质资源数据库数据挖掘平台-研究_第5页
资源描述:

《国家农作物种质资源数据库数据挖掘平台-研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据摘要国家农作物种质资源数据库拥有200种作物、4l万份种质信息、2400万个数据项值,数据量达230GB,是世界上最大的植物种质资源数据库之一。随着农业科学和计算机技术的发展,利用数据挖掘的原理、方法和技术发掘这些海量数据中蕴藏的信息,逐渐成为作物种质信息领域研究的重要内容。开展农作物种质数据挖掘平台研究对于充分发挥国家农作物种质资源数据库的作用,更好地保护和利用我国丰富的农作物种质资源具有十分重要的意义。论文根据国家农作物种质资源数据库的基础条件和发展需要,结合“大数据”时代下海量数据挖掘新的发展方向,把云计算相关技

2、术引入农作物种质资源数据挖掘中,以满足农作物种质数据不断增长所需的计算能力。论文研究了数据挖掘的基本理论、一般过程和常用方法,作为构建农作物种质资源数据挖掘平台的理论和技术基础,分析了国内外主流云计算平台,研究了开源云平台Hadoop的体系结构。在此基础上完成了基于云计算的农作物种质资源数据挖掘平台的总体设计和原型开发,并对所设计平台的架构、工作流程和各功能模块进行了详细描述。研究了经典Apriori关联规则算法基于MapReduce框架的并行化策略,利用JAVA编程实现了并行化的Apriori算法,并将其部署在挖掘平台上。利

3、用挖掘平台对国家农作物种质资源数据库进行试挖掘,初步获得了有关水稻种质特征特性的关联知识。在不同数据规模下,通过开展单机处理性能比较实验和平台加速比性能实验,测试了挖掘平台相关性能,最终论证了农作物种质资源数据挖掘平台的科学性、有效性和可行性。关键词:作物种质资源,数据挖掘,Hadoop,Apriori算法万方数据AbstractTheNationalCropGermplasmResourcesDatabasewith200kindsofcrops,410,000piecesofgermplasminformationand2

4、4millionpiecesofdataitemvalueisoneofthelargestdatabasesofplantgermplasmintheworld.Thedatacapacityofitis230GB.Withthedevelopmentoftheagriculturalresearch,ithasgraduallybeenimportantcontentintheresearchofcropgermplasmresourcesinformationthatdiggingtheinformationcontai

5、nedinthesevastamountsofdatabyusingtheprinciples,methodsandtechniquesofdatamining.TheapplicationofrelevantdataminingtechniquesisofgreatimportancetogivefullplaytoNationalCropGermplasmResourcesDatabase’SfimctionandprotectanduseOurnationalrichcropgermplasmresourcesbeUer

6、.Thispaperintroducedcloudcomputingandrelatedtechnologytodatadiggingofcropgermplasmresourcesinordertomeetthegrowingcomputingpowerneedsofthecropgermplasmdata,combiningwiththenewdevelopmentdirectionaccordingtObasicconditionsanddevelopmentalneedsofnationalcropgermplasmd

7、ata.Thispaperresearchedthebasictheory,generalprocessandcommonmethodsofdataminingwhichwasregardedastheoryandtechnicalfoundationtobuildcropgermplasmresourcedataminingplatform,analyzcdmaincloudcomputingplatformathomeandabroadandstudiedarchitectureofHadoop,anopen-SOurce

8、platform.Italsoaccomplishedmaindesignandprototypedevelopmentofcropgermplasmresourcesdataminingplatformbasedoncloudcomputing,anddescribedar

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。