欢迎来到天天文库
浏览记录
ID:37028707
大小:3.30 MB
页数:70页
时间:2019-05-15
《基于随机森林的PM2.5浓度预测模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、(Q)必姜部t大李硕士研究生学位论文基于随机森林的PM2.5浓度预测模型研究作者:杜续指导教师:冯景瑜副教授专业学位(领域):电子与通信工程一M论文日期:二〇八年六月硕士研究生学位论文基于随机森林的PM2.5浓度预测模型研究作者:杜续指导教师:冯景瑜副教授专业学位类别(领域):电子与通信工程提交论文日期:二○一八年六月单位代11664学号1501210147分类号TP391密级西安邮电大学硕士研究生学位论文题(中、英文)目基于随机森林的PM2.5浓度预测模型研究ResearchonPM2.5
2、concentrationmodelbasedonrandomforest作者姓名杜续指导教师姓名、职务冯景瑜副教授专业学位类别工程专业学位领域电子与通信工程提交论文日期二○一八年四月摘要摘要PM2.5颗粒物作为雾霾现象主要的危害性成分,不仅威胁人类健康、破坏自然环境,还对经济的发展造成了重大影响。对PM2.5进行科学、准确地预测预报工作,有助于环保部门制定相应的防范和治理措施,还可以为政府部门的政策提供科学依据,降低对人体的伤害。本文对PM2.5研究进展和预测方法进行了整理、分析,在此基础上,结合机器学习理论和统计预测方法,
3、基于随机森林算法设计出一种新的PM2.5浓度预测模型(RandomForestPretictionModel,RFP模型),进行PM2.5日均值浓度的预测。本文主要完成的工作如下:(1)选择PM2.5浓度较高的西安市地区为研究对象,基于Python语言和Scrapy框架,设计了爬虫的五大功能模块,实现了从多个网站自动爬取了西安市2013年10月28日至2018年1月31日的历史数据,包括PM2.5、PM10、SO2、NO2、CO、O3等大气污染浓度数据,温度、露点、湿度、海平面压强、能见度、风速、风向、风力、天气状态等气象条件
4、数据。使用牛顿插值法、3δ准则、前后均值修正法、one-hot编码等技术对原始数据做了大量的预处理工作,从而提高了PM2.5实验数据的质量。在此基础上,构建了专门针对PM2.5预测研究的高质量训练数据集。(2)利用统计学理论,从Pearson、Spearman相关系数(包括方差分析)和可视化两个方面定性分析并展示了PM2.5实验数据影响特征之间相关性的大小和方向。通过探索性分析,证明了季节(春季、夏季、秋季、冬季)以及前3日的大气污染物浓度和气象条件对当日PM2.5浓度产生的影响。通过相关性分析,为建立模型提供了数据和特征基础
5、,也为PM2.5的形成、来源、影响因素等提供了参考和理论依据。(3)基于相关系数法进行了特征的初步选择,共筛选34项高度相关的特征,分别建立了RFP-M1和RFP-M2模型;基于随机森林算法进一步筛选出17项特征,建立了RFP-M3模型;基于网格搜索算法和交叉验证法,建立了RFP-M4模型。分析对比了4种模型的性能。最后,从原理方法上,将RFP模型与BP神经网络(BackPropagationNeuralNetwork,BP-NN)模型进行对比,并将预测结果与线性回归(LinearRegression,LR)、决策树(Deci
6、sionTree,DT)、支持向量机(SupportVectorMachine,SVM)进行对比。实验结果表明,本文提出的RFP模型不仅能有效地预测PM2.5,还能在不影响预测精度的同时,较好地提升模型的运行效率,RFP模型只占BP-NN模型的2.1%。关键词:PM2.5浓度预测;随机森林;Scrapy;相关性分析;BP神经网络IABSTRACTABSTRACTPM2.5particulates,asthemainhazardouscomponentofsmog,notonlyseriouslythreatenhumanhea
7、lthanddestroynaturalenvironment,butalsohaveamajorimpactonChina'seconomicdevelopment.ScientificandaccuratepredictionofPM2.5willhelptheenvironmentalprotectiondepartmenttoformulatecorrespondingpreventiveandremedialmeasures.Itwillalsoprovidescientificbasisforthegovernme
8、nt'spoliciesandreducetheharmtothehumanbody.Inthispaper,theresearchprogressandpredictionmethodsofPM2.5aresortedandanalyzed.Basedonthis,comb
此文档下载收益归作者所有