随机森林在棉蚜虫害等级预测中的应用

随机森林在棉蚜虫害等级预测中的应用

ID:28413932

大小:81.00 KB

页数:8页

时间:2018-12-10

随机森林在棉蚜虫害等级预测中的应用_第1页
随机森林在棉蚜虫害等级预测中的应用_第2页
随机森林在棉蚜虫害等级预测中的应用_第3页
随机森林在棉蚜虫害等级预测中的应用_第4页
随机森林在棉蚜虫害等级预测中的应用_第5页
资源描述:

《随机森林在棉蚜虫害等级预测中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、随机森林在棉妍虫害等级预测中的应用摘要:棉虫牙是棉区的主要农业害虫之一,对于棉花的产量和质量影响较大。为了准确地对棉虫牙虫害的等级进行分类预测,以便采取科学的防治措施,该研究对山东省滨州地区1990-2009年的20年中5-9月的平均气温、降水量、相对湿度、日照时数等气象数据、棉酚天敌数据与棉酚虫害数据进行了相关性分析,筛选后保留的影响因子数据构建随机森林棉酚虫害等级预测模型。结果表明:随机森林模型的00B为5.7%,等级的误分率为0.09和0.019,经测试集检验,模型预测的准确率为82.2%0模型泛化性好,等级的误分率低。关键词:随机森林;棉虫牙;气象因子;等级预测中图分类号TP3

2、91;S431文献标识码A文章编号1007-7731(2017)01-0018-03Abstract:Cottonaphidisoneofthemainagriculturalpestsofcotton,forgreatereffectsontheyieldandqualityofcotton.Inordertoaccuratelyclassifythelevelofcottonaphidpestforecast,throughtheacquisitionofBinzhouareaofShandongProvinceregionfromMaytoSeptemberin1990-2009

3、,averagetemperature,precipitation,relativehumidity,sunshinehoursandothermeteorologicaldataandcottonaphidenemiesandAphisgossypiipestdatacorrelationanalysis,screeningofgossypiilevelpredictionmodel.ExperimentalresuItsshowthattherandomforestmodelof00Bwas5.7%,thelevelofpointerrorratewas0.09and0.019,h

4、aveexaminedthetestsetandmodelpredictionaccuracyis82.2%.Thegeneralizationofthemodelisgood,andtherateofmisclassificationislow.Keywords:Randomforest;Cottonaphid;Meteorologicalfactors;levelPrediction棉花是我国重要的经济作物之一,山东省滨州地区棉花种植面积广泛。棉呀是造成棉花减产的主耍害虫z—,由于其发生时间长,繁殖速度快,危害严重且防治困难,在一定程度上制约了滨州地区棉花的优质和高产。而气象条件和

5、天敌数量均对棉蜗产生直接的影响,为有效防治棉蜗的危害,学者们对棉蜗虫害的预测进行了大量的研究。如张金[1]等采用逐步判?e分析法分析了气候条件和棉蜗虫害等级的关系,构建了新疆石河子地区棉呀多元线性回归预测模型。吴昊[2]等对九江鄱阳湖地区棉呀发生规律和预报方法进行了研究,以丰富该地区的棉酚预报方法。慕彩云[3]等对东疆地区的棉虫牙预测构建了日预测、月预测及旬预测的线性回归模型。目前,在棉蜗预测模型的构建中多运用线性回归,但是在线性回归分析中采用何种因子进行表达只是一种推测,从而影响了因子的多样性和不可测性,使得回归分析在某些情况下的使用受到限制。随机森林在运算量没有显著提高的前提下提高

6、了预测精度,并但对于多元共线性不敏感,对缺失数据和非平衡数据比较稳健[4],而且模型训练速度快,样本选择具有随机性,不易产生过拟合。为此,本实验将随机森林用于棉虫牙虫害等级的短期预测中,提高了棉虫牙预测的效率和准确率,从而可以及时地为农业生产者提供准确的预警信息,提前采取防治措施,降低棉酚对棉花的危害。1随机森林算法随机森林算法[5]是2001年加利福尼亚大学的LooBroiman提出的,是一种由多个决策树组成的集成分类算法。集成学习现已成为国际机器学习界研究的热点机器学习范式[6]。随机森林中引入了2个随机化过程,使得不同的分类树具有不同的分类能力,当输入待分类样本时,随机森林输出的

7、结果由每个决策树的分类结果进行投票决定[7-8]。随机森林是一个树型分类器的集合。该算法中的元分类器是由CART算法组成但没有剪枝的分类冋归树。参数X是输入向量;是独立分布的随机向量,决定单棵决策树的生长过程。随机森林屮最重要的是如何构造一个随机森林。随机森林的算法步骤如下:(1)假设数据的样本数为N,那么每棵决策树采样的样本数就是N。在这N个样本中有放回的随机选择n(n〈N)个样本,用这n个样本来训练一棵决策树。(2)每个样本有M个属性,每棵

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。