基于机器学习建模方法的我国粮食种植面积影响因素研究.doc

基于机器学习建模方法的我国粮食种植面积影响因素研究.doc

ID:20057500

大小:68.12 KB

页数:4页

时间:2018-10-08

基于机器学习建模方法的我国粮食种植面积影响因素研究.doc_第1页
基于机器学习建模方法的我国粮食种植面积影响因素研究.doc_第2页
基于机器学习建模方法的我国粮食种植面积影响因素研究.doc_第3页
基于机器学习建模方法的我国粮食种植面积影响因素研究.doc_第4页
资源描述:

《基于机器学习建模方法的我国粮食种植面积影响因素研究.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于机器学习建模方法的我国粮食种植面积影响因素研究【摘要】粮食,不仅是人们日常生活的必需食品,还是保证国家粮食供给安全的重耍前提。为了综合度量各种因素对粮食总值面积的影响程度,本文建立影响粮食种植面积的指标体系,通过多种建模方法实证分析发现,影响我国粮食种植面积的主要因素有农业劳动力比重、农业机械总动力、农用化肥施用量等,粮食最低收购价格虽然会影响粮食种植血积,但发挥的作用很小。【关键词】粮食种植面积指标体系一、引言粮食种植面积是保证国家粮食供给安全的重要前提,研宄粮食种植妞积是十分冇意义的。国家

2、粮价收购政策、农业从业人员、粮食进出口贸易、农民受教育程度、城乡收入差距等因素都影响着粮食种植面积,为综合度量各因素对粮食种植面积的影响程度,下文将建立指标体系进一步分析。考虑到数据的可得性,再参考现有文献研宂成果的基础上,木文选取投入、产出及可持续发展三个方血的指标建立有关粮食种植血积的指标体系。为了更好的研究它们之间的关系,决定采用多元线性回归模型、Bagging,m-Boosting回归模型、支持向量机回归、决策树、神经网络等方法分别对其进行分析,以期得到最有效的结论。二、方法介?B在研究变

3、量对变量的影响或变量之间的关系时,人们最先想到的是回归,而线性回归模型的前提假设较多且要求较高,所以现实数据是很难满足这些条件,即使是满足,还要受到其他因素的影响,近年来,随着专家学者们对建模认识的逐渐深入,再加上计算机技术的快速发展,出现了诸如决策树、m-boosting等机器学习算法,这些算法模型在建模之前对数掘没有做出任何假定,使用的是诸如一致性、无偏性等概念进行建模,能够很好的解决多元线性回归的不足,预测精度高,所以木文在建模中引入机器学习方法对粮食种植面积进行研究。决策树(Decisio

4、nTree)是在己知概率的基础上,通过计算预期的净现值大于或者等丁零的概率来评价某一项冃运行的风险。随机森林是用随机的方式建立一个“森林”,森林里面有很多的决策树组成。Bagging与m-Boosting算法类似,区别在于Bagging训练集的选择是随机的,各轮训练集之间相互独立,而m-Boosting训练渠的选择不足独立的,各轮训练集的选择与前面各轮的学习结果冇关。神经网络本质上是人脑处理信息方式的简化模型。支持向量机(SVM,SupportVectorMachines)有两种功能,一是对数据进

5、行分类,二是对数据进行回归,目前主要用于对小样本、非线性及高维数据进行分类和回归。三、实证分析粮食种植面积指标体系的建立是从投入、产出及可持续发展三个角度出发的,投入是指种植粮食的成本,产出是指通过种植粮食获得的收入,可持续发展是综合考虑影响粮食种植面积的其他因素。具体的指标选择如下表:其中:自然灾害成灾率=成灾面积/受灾面积;人力资本:受教育程度初中及以上劳动力比重;农业劳动力比®:乡村就业人数占乡村总人口的比重;农业增加值比重=农业增加值/国内生产总值。数据来源于《中国统计年鉴2015》与《中

6、国农村统计年鉴2015》,时间维度为1990〜2014年。粮食最低收购价格用稻谷、小麦和玉米的平均价格计算。由于我国粮食最低收购价格政策是从2005年开始实施的,故粮食的最低收购价格只有2005年之后数据,2004年及之前的粮食最低收购价格用当年粮食的最低收购价格代替。在建模之前为了消除数量级和单位对模型精确性的影响,对数据进行标准化处理,利用标准化之后的数据进行建模,可以得出各种机器学习冋归方法关于训练集和测试集的错判率,具体如下表2:由上表可知,利用随机森林建模所得的训练集与测试集的错判率最低

7、,分别为0.084与0.729,故选择随机森林回归模型作为最终回归模型。通过随机森林回归模型可以得到每个变量的对粮食种植面积的重要性排名,结果显示农业劳动力比重、农业机械总动力、农用化肥施用量、农村居民家庭人均纯收入和农业增加值比重对粮食种植面积的影响排在前五位,其中前三名分别为劳动力投入、机械投入和资本投入,可以看到粮食种植的投入对种植面积的影响很大,排名第四和第五的指标属丁地区经济发展水平,显然地区经济发展水平对种植面积的影响也是非常大的。四、研究结论为了保障粮食安全,我国需要将增加农民收入放

8、在粮食保护政策的第一位。本文从投入、产出及可持续发展三个角度出发建立了粮食种植面积的指标体系,并利用多元线性、Bagging、m-Boosting回归模型、支持向量机、决策树、随机森林、神经网络等回归模型分别对粮食种植面积的影响因素进行了分析,分析表明,使用随机森林建模方法随机森林准确度最高。对影响因素的重要性进行度量可以发现,排名前五位的为农业劳动力比重、农业机械总动力、农用化肥施用量、农村居民家庭人均纯收入和农业增加值比重,可以得到粮食最低收购价对粮食种植血积有一定的影响,但其

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。