欢迎来到天天文库
浏览记录
ID:38148899
大小:904.38 KB
页数:4页
时间:2019-05-26
《数据挖掘技术在农业机械质量控制中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2007年5月农业机械学报第38卷第5期数据挖掘技术在农业机械质量控制中的应用胡宇轩阎楚良【摘要】针对传统质量信息分析方法只能获得产品故障表层信息这一问题,对数据挖掘技术在农业机械产品质量控制管理系统中的应用进行了研究,提出了以产品故障信息为基础的外部质量控制和分析的方法。经过运行测试证明:将决策树算法应用到系统中,可以为产品故障现象到故障原因的分析提供比较客观的决策支持。关键词:农业机械质量控制数据挖掘决策树中图分类号:TP392文献
2、标识码:A﹥┈┃┃﹫│┅━│┃┉┉┄┃┄┃﹥┉┃┃┃┄━┄┎┃┊━┉┎﹤┄┃┉┇┄━┄﹢┇┊━┉┊┇━┃┇┎HuYuxuanYanChuliang(爞牎牏牕牉牞牉爛牅牃牆牉牔牪牗牊爛牋牜牏牅牣牓牠牣牜牃牓爩牉牅牎牃牕牏牫牃牠牏牗牕爳牅牏牉牕牅牉牞)﹢┈┉┇┉Inthispapertheapplicationofdataminingtechnologyinqualitycontrolofagriculturalmachinerywasstudiedandqualitycontrolandanaly
3、semethodbasedonproductfaultwaspresented,aimingattheproblemthatsuperficialinformationofproductfaultwasgotbytraditionalanalyticalwayofqualityinformation.Afterstricttestandrunning,usingdecisiontreealgorithmofdatamininghelpedtheenterprisemakesobjectivedecisionintheanalyseoftherelationbetween
4、appearanceandreasonofproductfault.┎┌┄┇┈Agriculturalmachinery,Qualitycontrol,Datamining,Decisiontrees引言数据挖掘中的决策树算法近年来数据库技术得到了广泛的应用,许多企分类算法是数据挖掘中非常重要的方法[4],将业纷纷建立了数据库,积累了大量的数据[1~2]要解决的问题视为一个对象或事件归类,既可以使。企业在长期的客户服务过程中积累了大量的经验,将这用分类模型来分析已有的数据,也可以用它来预测些经验转换为规律应用在农业机械生产中,可以从未来的数据。分类的目的是分析输
5、入的数据,通过观质量信息中挖掘出大量的有价值信息。传统的数据察处于数据源的数据表现出来的特性,为每一个类分析方法只能获得这些产品故障数据的表层信息,找到一种准确的描述或者模型,这种描述通常用谓并不能获得数据属性的内在关系和隐含的信息,而词来表示;由此生成的类描述可以用于对未来的数要解决这类问题,数据挖掘技术是一种方便有效的据进行分类。建立模型后,可以对数据记录中的每一解决方案[3]个类有更好的理解,即获得了对这个类的概念和知。利用数据挖掘技术对农业机械产品故障数据源中的数据进行分析,采用分级判别的方法,识。分类算法具体分为:决策树算法、贝叶斯分类、遗对故障的诊断逐步细化
6、,最终可得出引发故障的具传算法、粗糙分类等。体原因。决策树是一种表现一系列导致类或值的规则的收稿日期:20070107国家科技基础平台建设项目(项目编号:2003DIB2J096)胡宇轩中国农业机械化科学研究院硕士生,100083北京市阎楚良中国农业机械化科学研究院研究员博士生导师154农业机械学报2007年方法,是一个类似于流程图的树结构,最顶层是根节中。该系统数据挖掘技术点,下面每个内部节点表示一个属性上的测试,每个的开发流程如图1所示。分枝代表一个测试的输出,每个叶子节点表示类或数据预处理类的分布。它可以生成易于理解的规则。选择具有整理原始数据最
7、高信息增益的字段作为节点的测试属性,这种方直接利用原始数据进法称为属性选择度量或者分裂的优良性度量。这使行数据挖掘是不实际的。得结果划分中的数据分类所需要的信息量最小,并数据预处理模块为数据挖且反映了划分的最小随机性。这种基于信息理论的掘算法提供完整、干净、准图1开发流程图方法使得对于一个对象分类所需的期望测试的次数确、有针对性的数据。本系Fig.1Flowchart最小,而且确保找到一棵简单的树。统中的数据来自集团下属各公司、部门不同的数据库或者系统,信息庞杂,采分裂的优良性度量计算集和加工的方法有别,数据描述的格式也各不相设爳是牞个
此文档下载收益归作者所有