数据挖掘技术在农业领域的应用

数据挖掘技术在农业领域的应用

ID:5300992

大小:342.45 KB

页数:4页

时间:2017-12-07

上传者:U-3887
数据挖掘技术在农业领域的应用_第1页
数据挖掘技术在农业领域的应用_第2页
数据挖掘技术在农业领域的应用_第3页
数据挖掘技术在农业领域的应用_第4页
资源描述:

《数据挖掘技术在农业领域的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

2010年7月农机化研究第7期数据挖掘技术在农业领域的应用刘春玲,崔凌云,贾冬青,郝国芬,张焕生(河北工程技术高等专科学校,河北沧州061O01)摘要:数据挖掘作为一项极具应用前景的技术,在处理农业领域积累的大量农业数据信息中起着非常重要的作用。为此,结合农业领域的特点,系统综述了聚类分析、决策树、关联规则、粗糙集等主要数据挖掘技术在农业中的应用现状以及应用前景。关键词:数据挖掘;农业信息;应用中图分类号:S126文献标识码:A文章编号:1003—188X(2010)07—0201—04数据挖掘过程主要包括确定业务对象、数据准备、数0引言据挖掘、结果分析4个步骤。常用的数据挖掘方法有信息化是一个国家和地区的经济增长能力、综合聚类分析、决策树、关联规则、遗传算法、粗糙集等。实力和竞争力的重要体现。加快农业信息化进程是推1.1聚类分析动农业和农村经济发展、农民增收致富、农村社会稳聚类是把一组个体按照相似性归纳成若干类别,定的一项重要战略措施。随着计算机技术在农业生产即“物以类聚”。其目的是使得属于同一类别的个体中的广泛应用,农业科技人员获取、积累了大量与农之间的距离尽可能小,而不同类别上的个体问的距离业生产过程密切相关的属性数据和空间数据,这些数尽可能大。利用聚类分析抽取学习样本,首先将数据据真实、具体地反映了农业生产作业的本质状况,是集划分为个不相交的“类”,然后对这个类中指导区域精准作业的宝贵财富。但由于农业生产的的数据对象分别进行随机抽取,这样就可以最终获得复杂性,使得农业数据具有丰富、多维、动态、不完整、聚类采样数据子集。聚类方法包括统计方法、机器学不确定等特性,导致了我们“淹没在数据的海洋中,习方法、神经网络方法和面向数据库的方法。目前,数据丰富,知识贫乏”,所以需要用一种方法从上述结常用的聚类分析算法比较有代表性的有K2MEANS算构化和半结构化的大量数据中找出隐藏的规律,根据法、BIRCH算法、STNG算法、神经网络方法、DBSCAN规律制定正确的农业策略,达到使农业生产持续、高算法等。聚类分析算法常应用模式识别和空间数据效、协调发展的目的。数据挖掘技术(DataMining,分析等。DM)作为一种重要的数据处理和知识发现的技术,能1.2决策树够有效地从农业信息数据中找出潜在的和有用的农决策树是一棵树,树的根节点是整个数据集合空业知识,为农业部门的科学决策和知识管理提供支间,每个分节点是对一个单一变量的测试,该测试将持,因此数据挖掘技术在农业领域中有着,一阔的应用数据集合空间分割成2个或更多块。每个叶节点是前景。属于单一类别的记录。首先,通过训练集生成决策树,再通过测试集对决策树进行修剪。决策树的功能1数据挖掘方法是预言一个新的记录属于哪一类。决策树分为分类数据挖掘就是利用各种分析工具在海量数据中树和回归树两种,分类树对离散变量做决策树,回归发现模型和数据问关系的过程。使用这些模型和关树对连续变量做决策树。系可以进行预测,并帮助决策者寻找数据间潜在关1.3关联规则联,发现被忽略的因素,因而被认为是解决当今时代关联规则是从大量的数据中或对象间抽取其相所面临的数据爆炸而信息贫乏问题的一种有效方法。互之间的关联性,揭示数据间未知的依赖关系,根据这种依赖关系,可以从某一数据对象的信息推断出另收稿日期:2009—10—26一数据对象的信息。关联规则比较典型的算法有作者简介:刘春玲(1980一),女,河北沧州人,助教,硕士,(E—mail)liuchunling80@yahoo.tom.(31。Apriori算法和FP2Tree算法,FP2Tree算法是在Apri— 20l0年7月农机化研究第7期ori算法的基础上改进的,采取分而治之的策略,不产几个方回。生候选集,而是将数据库的信息压缩成一个描述频繁2.1‘数据挖掘在农业环境分析中的应用项相关信息的频繁模式树,因而具有较好的完整性和数据挖掘在农业环境监测和环境保护方面起到紧密性。非常重要的作用。我国历来对农业环境状况十分重1.4遗传算法视,在基本农田检测、污水灌溉、面源污染、食品安全、遗传算法是计算数学中用于解决最优化的索算生态农业法规标准等方面都积累并不断扩充着大量法,是进化算法的一种。进化算法最初是借鉴了进化数据。利用数据仓库技术和数据挖掘技术对大量积生物学中的一些现象而发展起来的,这些现象包括遗累的农业环境数据进行挖掘,对有效把握农业环境状传、突变、自然选择以及杂交等。况的全局,了解农业污染发展趋势和实施农业环境保遗传算法通常实现为一种计算机模拟。对于一护战略提供有力保障。个最优化问题,一定数量的候选解(称为个体)的抽郑向群等从土壤养分的数据库中,挖掘出土壤肥象表示(称为染色体)的种群向更好的解进化。传统力评价规则,指导农业生产的科学施肥,从农田土壤上,解用二进制表示(即0和1)的串,但也可以用其环境质量状况数据和农作物生长条件的知识,能够挖它表示方法。进化从完全随机个体的种群开始,之后掘出农产品的质量状况,可以分析出导致农产品质量一代一代发生。在每一代中,整个种群的适应度被评状况恶化可能的环境或生态方面的原因;赵怿逖采价,从当前种群中随机地选择多个个体(基于它们的用模糊评价算法在综合考虑污染物因子的基础上按适应度),通过自然选择和突变产生新的生命种群,该地区实际条件评测环境,并采用算法找出污染物因子种群在算法的下一次迭代中成为当前种群,即产生出Apriori之间的相关性,从而挖掘出导致环境差异的具代表新的解集种群。这个过程将导致种群像自然进体原因j;杨杨等借助数据仓库为农业环境监测部门化一样,后生代种群比前代更加适应于环境,末代种构建农业环境监测系统,分别采集土壤、空气和灌溉群中的最优个体经过解码(decoding),可以作为问题水3个环境要素的26种污染因子,运用序列分析、聚近似最优解。类分析和关联分析对环境综合分析,预测环境变化趋1.5粗糙集势,有效降低了农业污染的控制成本。粗糙集理论是波兰数学家Z1Pawlak在1982年2.2数据挖掘在病虫害防治决策中的应用提出的一种可以分析模糊和不确定问题的数学理论。数据挖掘在农业病虫害管理中的应用,主要集中这一理论从新的视角出发对知识进行了定义,它把知在病虫害动态监测、发生趋势预测及其风险评估等几识看作是关于论域的划分,并引入代数学中的等价关个方面。农作物病虫害的发生受作物布局、栽培耕作系来讨论知识。它提供了一整套方法,从数学上严格条件、品种抗性和气象条件等诸多因素的影响,同时地处理数据分类问题,是一种比较适用的归纳、分类也与一定的地理空间相关。数据挖掘技术可以用于方法。粗糙集理论的特点是无需提供除问题所需处预测某段时问发生虫害的可能性,以及发生其它种类理的数据集合之外的任何信息。随着粗糙集理论的虫害的可能性,从而为病虫害防治提供决策支持。日趋成熟,它在各个方面的应用也越来越广泛,如大符保龙从影响病虫害发生量的气候因子角度来气质量预测分析、股票数据分析、模式识别、地震预分析,将开发的神经网络模型用于广西柳江县田问报、空问数据分类以及医学上的各种病情分析诊断RBF水稻虫害的预测,使用第1~3年的5—10月等,粗糙集理论在农业病害规则发现中也得到应用。的病虫害数掂,成功地预测出第3年5—10月病虫害的发生情况;刷启生构建果园的病虫害挖掘平台并2数据挖掘在农业中的应用应用于果园病虫害防治,能预测某段时问发生虫害并我国是一个农业大国,农业领域的原始信息是海提供病害虫综合防治决策;任长伟等将空间关联规量的和异构的,其中包括大量模糊的、不完整的、带有则挖掘用于森林病虫害,对历史病虫害数据挖掘规律噪声和冗余的信息。利用数据挖掘技术对大量积累和森林病虫害分布特征结合建立森林病虫害预测模的农业信息进行挖掘,可以克服“数据丰富而知识贫型,实现GIS数据管理和分析的科学化,并实现森林乏”现象,寻找各种因素的内在联系和规律用于指导病虫害区域的可视化展现-,。农业生产,这对作物的高产、优质具有十分重要的意2.3数据挖掘在农业专家系统中的应用义。目前,数据挖掘在农业中的应用主要集中在以下农业领域存大量的领域知识,如何利用这些领·202· 2010年7月农机化研究第7期域知识引导挖掘过程产生有意义的结果是农业数据的研究领域,目前只是取得了初步成果,有大量的理挖掘中的重要问题。一方面,数据挖掘过程是一个不论与方法需要深人研究。断重复的交互过程,领域专家参与和引导能获得更精3.1数据输入形式的多样性确和实用的知识;另一方面,农业专家系统由于数据农业领域中存在一些半结构化、非结构化的数据采集缺少统一标准,而且数据复杂且具有一定的偶然形式,如文本、图形、数学公式、图像或Www资源,性,往往需要数据挖掘来二次知识发现。利用数据挖目前的数据挖掘工具一般只能提供对数值型的结构掘技术对海量的数据进行处理,从而使农业专家系统化数据的处理,对数据中存在缺损或噪声的情况尚无具有自学习、自适应等能力,因此基于数据挖掘的农有效的解决方法,数据输入形式的多样化是亟待解决业专家系统现在已成为农业专家系统的重要发展方的问题。向之一。3.2基于不确定性和模糊性的空间数据挖掘基于数据挖掘的农业专家系统通常由人机界面、精准农业中由于技术手段的限制或人为的误差,推理机、数据挖掘模块、数据库和知识库构成。数据空间数据中存在大量的不确定性和模糊性,研究基于挖掘模块通常负责从数据库中发现知识,并且管理和不确定性和模糊性的空问数据挖掘技术就显得尤为挖掘模块通常负责从数据库中发现知识维护知识库;迫切。空问统计学、证据理论、模糊集和粗糙集等方推理机基于知识库作智能推理。例如,张文静等通过法是处理不确定性的很好方法,把这些方法应用于空关联规则的Apriori算法挖掘出各个数据项之间有价间数据挖掘领域有待于进一步拓展。值的联系,以农作物病虫害为例建立农业专家系统的3.3数据仓库与时空数据挖掘知识库,并验证了关联规则在决策推理中的作用;由于农业生产的复杂性、连续性,各种数据库需顾静秋基于XML元数据模型利用关联规则挖掘要集成数据仓库,而空间数据挖掘也有随时间的改变MAQA算法构造知识库,并将知识用于主观Bayes推而改变的现象。因此,数据仓库和时空数据挖掘的研理且取得很好的效果。究是今后数据挖掘发展的必然趋势。2.4数据挖掘在农业电子商务中的应用3.4知识的可视化表示与用户的参与性农业电子商务是指利用互联网的易用性、广域性理解所发现知识的最有效的方式是进行图形可和互通性,为从事涉农领域的生产经营主体提供在网视化。可视化仍是一个不成熟的领域,有待于进一步上完成产品或服务的销售和电子支付等业务交易的研究。有效的决策过程往往需要多次交互和多次反过程。数据挖掘技术能从海量的网络信息中挖掘出复,使数据挖掘的结果准确并易于表达,实现在多抽有用的信息,能自动预测客户的消费趋势和市场走象层次上交互挖掘知识。目前,许多知识发现系统和向,指导农业企业建设个性化的智能网站,为农业企工具缺乏与用户的交互,难以有效利用领域知识。业创造新的商业增长点。李业刚等利用模糊数据关系矩阵对农业企业系4结束语统的任一时间、单位、类型的利润建立相似关系,采任何产业的快速发展都离不开高新技术,农业的用最大树法聚类分析,为农产品预测趋势和决策行为发展必然要走信息化道路。数据挖掘技术作为具有提供支持¨;刘德军等“基于数据挖掘的现代农业物流管理系统”利用分类知识发现、数据聚类、关联规则潜力巨大的研究领域,通过与现代农业相结合,将在发现、序列模型发现和趋势预测等数据挖掘方法,提农业科研、生产、管理等方面发挥巨大的作用,这对推供立体的、多视角的、有渗透力的知识,从而提高现代动我国农业现代化的发展具有重要的作用。农业物流管理决策能力和决策准确性,减少因决策失参考文献:误而造成的经济损失⋯;余小高先采用数据预处理[1]邵峰晶,于忠清.数据挖掘原理与方法[M].北京:中国水利水电出版社,2003.大量异构的、分布的、半结构化的数据,通过协同过[2]郑向群,高怀友,周军,等.农业环境信息数据分析中数据滤、聚类分析和关联规则等数据挖掘技术挖掘出农业挖掘技术的应用[J].农业环境与发展,2003(1):35—37.电子商务中潜在的模式,使企业能及时应对市场变[3]赵怿.数据挖掘在农业环境中的应用[D].天津:天津大化,占领市场的制高点。学,2004.3发展前景[4]杨杨,赵政.基于数据仓库的农业环境监测系统的研究与实现[J].计算机工程与应用,2007,43(9):211—214.数据挖掘在农业上是一个非常年轻而富有前景[5]符保龙.RBF网络在农业病虫害预测中的应用研究[J].·203· 2010年7月农机化研究第7期安徽农业科学,2008,36(1):388—389.的应用研究[J].沈阳师范大学学报,2008,26(3):310—[6]周启生.数据挖掘技术在病虫害防治决策中的应用[J].313.农业网络信息,2004(7):8—10.[12]胡彩平,秦小麟.空间数据挖掘研究综述[J].计算机科[7]任长伟,尚艳英,曹彦荣.基于GIS与空问关联规则数据学,2007,34(5):14—19.挖掘在森林病虫害预测中的应用初探[c]//昆明:第四届[13]JoseFernando,O~egaAlvarez.Aneconomicoptimization海峡两岸GIS发展研讨会暨中国GIS协会第十届年会,modelforirrigationwatermanagement[J].IrrigationSci—2006:743—748.ence,2004(23):61—75.[8]张文静,卢海霞,杨捧,等.基于关联规则的农业专家系统[14]陆晓希,黄力.基于粗糙集理论及其在农业病害规则发知识库的建立[J].农机化研究,2008(7):93—95.现中的应用[J].安徽农业科学,2006,34(3):3251—3[9]顾静秋.农业专家系统的知识获取、表示与推理[J].农业252.办公自动化,2004,66(1):32—34.[15]孙微微,胡月明,刘才兴.基于决策树的土壤质量等级研[1O]李业刚,宋道金,王淑君,等.农业电子商务中模糊数据究[J].华南农业大学学报(自然科学版)2005(3):108一挖掘技术的应用[J].农机化研究,2008(1):178—180.l10刘德军,张广胜.数据挖掘在现代农业物流管理决策中ApplicationofDataMiningintheFieldofAgricultureLiuChunling,CuiLingyun,JiaDongqing,HaoGuofen,ZhangHuansheng(HebeiEngineeringandTechnicalCollege,Cangzhou061001,China)Abstract:Datamining,asoneofthegreatestapplicationtechnologyplaysanimportantroleindealingwithalarge,numberofagriculturedatainthefieldofagriculture.Combinedwiththecharacteristicsofagriculturesystematicallythis,papersummarizestheapplicationstatusandapplicationprospectofdataminingtechnologyinagriculture.Thesetechnolo—giescontainclusteranalysis,decisiontrees,associationrules,roughsets,etc.Keywords:datamining;agriculturalinformation;application(上接第196页)AbstractID:1003—188X(2010)07—0193一EAResearchonAgriculturalProductTraceabilitySystemBasedonAgentMaYong,ZhuYeping(AgriculturalInformationInstitute,TheChineseAcademyofAgriculturalSciences,Beijing100081,China)Abstract:Itgapowerfulmeasurethatbuildingtraceabilitysystemtoguaranteethequalityofagriculturalproducts.TheAgenttechnology,whichhasadvantagesinthediagnosisandresponsetoincidents,providesanewwayofthinkingfortheconstructionoftraceabilitysystem.Therefore,thispapermakesabriefintroductionofAgenttechnology,theresearchsta—tusoftraceabilitysystembasedonagentanddiscussesthemechanismofAgent—·basedagriculturalproducttraceabilitysystem.Finally,theprobabledificultiesintheapplicationofAgentte,~hnologyandproblemstobesolvedarepointedout.Keywords:agriculturalproduct;agent;multi—agentsystem;traceabilitysystem

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭