数据挖掘技术在农业领域的应用

数据挖掘技术在农业领域的应用

ID:5300992

大小:342.45 KB

页数:4页

时间:2017-12-07

数据挖掘技术在农业领域的应用_第1页
数据挖掘技术在农业领域的应用_第2页
数据挖掘技术在农业领域的应用_第3页
数据挖掘技术在农业领域的应用_第4页
资源描述:

《数据挖掘技术在农业领域的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2010年7月农机化研究第7期数据挖掘技术在农业领域的应用刘春玲,崔凌云,贾冬青,郝国芬,张焕生(河北工程技术高等专科学校,河北沧州061O01)摘要:数据挖掘作为一项极具应用前景的技术,在处理农业领域积累的大量农业数据信息中起着非常重要的作用。为此,结合农业领域的特点,系统综述了聚类分析、决策树、关联规则、粗糙集等主要数据挖掘技术在农业中的应用现状以及应用前景。关键词:数据挖掘;农业信息;应用中图分类号:S126文献标识码:A文章编号:1003—188X(2010)07—0201—04数据挖掘过程主要包括确定业务对象、数据准备、数0引言据挖掘、结果分析4个步骤。常用的数据挖掘方法有

2、信息化是一个国家和地区的经济增长能力、综合聚类分析、决策树、关联规则、遗传算法、粗糙集等。实力和竞争力的重要体现。加快农业信息化进程是推1.1聚类分析动农业和农村经济发展、农民增收致富、农村社会稳聚类是把一组个体按照相似性归纳成若干类别,定的一项重要战略措施。随着计算机技术在农业生产即“物以类聚”。其目的是使得属于同一类别的个体中的广泛应用,农业科技人员获取、积累了大量与农之间的距离尽可能小,而不同类别上的个体问的距离业生产过程密切相关的属性数据和空间数据,这些数尽可能大。利用聚类分析抽取学习样本,首先将数据据真实、具体地反映了农业生产作业的本质状况,是集划分为个不相交的“类”,然后

3、对这个类中指导区域精准作业的宝贵财富。但由于农业生产的的数据对象分别进行随机抽取,这样就可以最终获得复杂性,使得农业数据具有丰富、多维、动态、不完整、聚类采样数据子集。聚类方法包括统计方法、机器学不确定等特性,导致了我们“淹没在数据的海洋中,习方法、神经网络方法和面向数据库的方法。目前,数据丰富,知识贫乏”,所以需要用一种方法从上述结常用的聚类分析算法比较有代表性的有K2MEANS算构化和半结构化的大量数据中找出隐藏的规律,根据法、BIRCH算法、STNG算法、神经网络方法、DBSCAN规律制定正确的农业策略,达到使农业生产持续、高算法等。聚类分析算法常应用模式识别和空间数据效、协调

4、发展的目的。数据挖掘技术(DataMining,分析等。DM)作为一种重要的数据处理和知识发现的技术,能1.2决策树够有效地从农业信息数据中找出潜在的和有用的农决策树是一棵树,树的根节点是整个数据集合空业知识,为农业部门的科学决策和知识管理提供支间,每个分节点是对一个单一变量的测试,该测试将持,因此数据挖掘技术在农业领域中有着,一阔的应用数据集合空间分割成2个或更多块。每个叶节点是前景。属于单一类别的记录。首先,通过训练集生成决策树,再通过测试集对决策树进行修剪。决策树的功能1数据挖掘方法是预言一个新的记录属于哪一类。决策树分为分类数据挖掘就是利用各种分析工具在海量数据中树和回归树两

5、种,分类树对离散变量做决策树,回归发现模型和数据问关系的过程。使用这些模型和关树对连续变量做决策树。系可以进行预测,并帮助决策者寻找数据间潜在关1.3关联规则联,发现被忽略的因素,因而被认为是解决当今时代关联规则是从大量的数据中或对象间抽取其相所面临的数据爆炸而信息贫乏问题的一种有效方法。互之间的关联性,揭示数据间未知的依赖关系,根据这种依赖关系,可以从某一数据对象的信息推断出另收稿日期:2009—10—26一数据对象的信息。关联规则比较典型的算法有作者简介:刘春玲(1980一),女,河北沧州人,助教,硕士,(E—mail)liuchunling80@yahoo.tom.(31。Ap

6、riori算法和FP2Tree算法,FP2Tree算法是在Apri—20l0年7月农机化研究第7期ori算法的基础上改进的,采取分而治之的策略,不产几个方回。生候选集,而是将数据库的信息压缩成一个描述频繁2.1‘数据挖掘在农业环境分析中的应用项相关信息的频繁模式树,因而具有较好的完整性和数据挖掘在农业环境监测和环境保护方面起到紧密性。非常重要的作用。我国历来对农业环境状况十分重1.4遗传算法视,在基本农田检测、污水灌溉、面源污染、食品安全、遗传算法是计算数学中用于解决最优化的索算生态农业法规标准等方面都积累并不断扩充着大量法,是进化算法的一种。进化算法最初是借鉴了进化数据。利用数据仓

7、库技术和数据挖掘技术对大量积生物学中的一些现象而发展起来的,这些现象包括遗累的农业环境数据进行挖掘,对有效把握农业环境状传、突变、自然选择以及杂交等。况的全局,了解农业污染发展趋势和实施农业环境保遗传算法通常实现为一种计算机模拟。对于一护战略提供有力保障。个最优化问题,一定数量的候选解(称为个体)的抽郑向群等从土壤养分的数据库中,挖掘出土壤肥象表示(称为染色体)的种群向更好的解进化。传统力评价规则,指导农业生产的科学施肥,从农田土壤上,解用二进制表示(即0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。