基于主曲线的空气悬浮颗粒物质PM10的预测.pdf

基于主曲线的空气悬浮颗粒物质PM10的预测.pdf

ID:49228973

大小:534.43 KB

页数:5页

时间:2020-02-28

基于主曲线的空气悬浮颗粒物质PM10的预测.pdf_第1页
基于主曲线的空气悬浮颗粒物质PM10的预测.pdf_第2页
基于主曲线的空气悬浮颗粒物质PM10的预测.pdf_第3页
基于主曲线的空气悬浮颗粒物质PM10的预测.pdf_第4页
基于主曲线的空气悬浮颗粒物质PM10的预测.pdf_第5页
资源描述:

《基于主曲线的空气悬浮颗粒物质PM10的预测.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第32卷第2期平顶山学院学报Vol.32No.22017年4月JournalofPingdingshanUniversityApr.2017基于主曲线的空气悬浮颗粒物质PM10的预测王礼云,朱振伸,董瑞瑞(郑州工业应用技术学院信息工程学院,河南郑州451150)摘要:对空气中有害物质(例如PM10)浓度的预测具有重要的现实意义,但绝大多数情况下,这类数据具有不均衡、在线贯序到达的特点,利用传统监督学习方法难以实现快速、有效的预测.为解决该问题,提出了一种基于主曲线的PM10预测方法,建立2010年到2012年PM1

2、0的模型,拟合得到相应的参数,最终得到主曲线预测模型,并通过大量实验分别设定不同浓度PM10相应的阈值.研究表明,基于主曲线的PM10预测模型预测速度快、误差小,同时网络结构更加紧凑.关键词:主曲线;悬浮颗粒物质PM10;不均衡中图分类号:TP181文献标识码:A文章编号:1673-1670(2017)02-0021-050引言近年来,环境恶化造成空气中有害物质浓度的升高,已对城市居民的身体健康造成重大影响.对污染物浓度进行预测有助于提前准备预防措施,缓解疾病症状,因此具有显著的现实意义.相比对气态污染物(SO2、

3、NO2和O3等气体氧化物)的预测,对悬浮颗粒物PM10浓度的预测可带来更加直观的结果,因此是目前空气质量评估的研究热点.大多数情况下,空气中的污染物浓度偏低,空气质量良好,出现雾霾等天气的比例较低,因此,所监测到的空气质量数据具有类别严重不均衡的特点.此外,该类型数据按照日期贯序到达,具有在线预测的特点.同时,对数据集中的小类,错分代价通常比大类高出许多.目前,针对不均衡数据的分类问题提出了多种改进算法.改进方向可以分为两类:一类是从数据集的[1]角度,另一类是从算法角度.数据层面的处理方法主要包括过抽样策略和欠抽

4、样策略,该处理方法是通过一些机制改善不均衡数据集,以期获得一个均衡的数据分布.但过抽样算法采用的是重复少数类样本或生成人工样本的方式实现样本均衡,这样会增加训练时间,且容易产生过拟合现象.而欠抽样算法采用的[2]是删除多类样本的方式实现样本均衡,容易导致丢失重要的样本信息.算法角度主要包括改变概率密度、单类学习分类、集成算法代价敏感学习及核方法等,但这些方法都是针对单核情况进行分析的,然而采用单核进行映射的方式对所有样本进行处理并不合理.此外,在实际应用中所有的数据不是一次到达,且[3]要求在线预测;为了解决此问题

5、,Liang等人引入了ELM算法,并提出了在线序列ELM算法.但由于不均衡数据的存在致使在线序列ELM算法的网络结构不能达到预期的误差且网络结构不稳定,因此针对不均衡数据的在线贯序预测算法的研究越来越受到机器学习学术界的重视.1主曲线[4]Hastie和Stuetzle于1984年提出了主曲线的概念,主曲线是寻找一种几何上直观,理论上完备,算法上可行的方法来描述数据集合的内在结构的方法,它是主成分的非线性推广,基本思想是要寻找通过数据分布的中间,并满足自相合特性的光滑曲线.收稿日期:2016-07-16基金项目:国

6、家自然科学基金(U1204609)作者简介:王礼云(1986—),女,河南省驻马店市人,硕士,郑州工业应用技术学院信息工程学院教师,主要研究方向:机器学习与最优化理论.·22·平顶山学院学报2017年[5]dd令f(λ)=(f1(λ),f2(λ),…,fd(λ))为在参数λ∈R上的R维曲线,对任何X∈R,令λf(x)表示x和f(λ)之间的最小正交距离时的投影指标,λf(x)定义为λf(x)=sup{λ:x-f(λ)=infx-f(τ)},(1)τx投影到f上的点为f(λf(x)),2=x-f(λ2.(2)Δ(x,f

7、)=infx-f(λ)f(x))a≤t≤b主曲线的算法步骤如下:(0)步骤1令初始曲线f(λ)为X的第一主成分线,设j=0;d步骤2(投影步)对所有x∈R,求λf(j)(x)=max{t:x-f(λ)=minxτ-f(τ)};(j+1)步骤3(期望步)定义f(λ)=E[X

8、λf(i)(X=λ)];(j+1)(f)步骤4如果1-小于某个阀值,则停止,否则,令j=j+1,转步骤2.((j))(f)2数据处理由于采集数据的局限,笔者采用澳门气象局网站上公布的空气质量数据作为算例.首先简介数据采集过程和背景;其次描述了

9、数据采样、数据处理和变量选择过程.尽管空气中含有很多的污染物质,笔者只选择PM10污染物进行预测.其他空气污染物水平可用类似的方式进行预测.2.1数据的采集2[5]澳门位于中国大陆南部海岸,占地仅32.8km,有3个土地区域:澳门半岛、氹仔岛和路环岛.类似于内地的许多沿海城市,澳门在过去的10年经历了快速发展,空气污染已成为一个重要的健康问题.澳门政府气象中

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。