欢迎来到天天文库
浏览记录
ID:33544520
大小:310.36 KB
页数:5页
时间:2019-02-27
《基于主成分分析和支持向量机的区域降水研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、万方数据第15卷第2期2009年5月广西民族大学学报(自然科学版)JOURNALOFGUANGXIUNIVERSITYFORNATIONALITIES(NaturaIScienceEdition)VoI.15No.2Mav2009基于主成分分析和支持向量机的区域降水预测应用研究’农吉夫(广西民族大学数学与计算机科学学院,广西南宁530006)摘要:将主成分分析和支持向量机回归相结合,以广西5、6月区域平均日降水量.作为预报对象,进行区域日降水量预测研究.首先,整理分析大量的T213数值预报产品信息数据进行主成分分析,得到主成分数据序列;其次,根据主成分数
2、据序列建立训练集训练支持向量机,并利用遗传算法优化参数;最后。输入支持向量机所需数据,得到主成分预测结果,建立广西日降水预报模型.实例计算结果表明,支持向量机回归模型比逐步回归模型有更好的预测能力.关键词:主成分分析;支持向量机;遗传算法}预测中图分类号:0213文献标识码:A文章编号:1673—8462(2009)02一0089--050引言目前统计学降尺度方法已被广泛应用于研究和评估区域气候变化影响u~20.统计降尺度法利用多年的观测资料建立大尺度气候状况(主要是大气环流)和区域气候要素之间的统计关系,并用独立的观测资料检验这种关系,最后再把这种关系
3、应用于输出的大尺度气候信息,来预估区域未来的气候变化情景(如气温和降水).从观测样本数据出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测的工作,其实现方法大致可以分为三种:参数统计估计方法;非线性方法;统计学习理论.其中。统计学习理论是一种专门研究小样本情况下机器学习规律的理论.该理论针对小样本统计问题建立了一套新的理论体系,在这种体系下的统计推理规则不仅考虑了对渐近性能的要求,而且追求在现有有限信息的条件下得到最优结果.统计学习理论为解决有限样本的学习问题提供了一个统一的框架,有望帮助解决许多原来难以解决的问题,如多元线性回归维数灾问题、神
4、经网络结构选择问题、局部极小点问题等.同时,在这一理论基础上发展的一种新的通用学习方法:支持向量机(SupportVectorMachine,简称SVM)已表现出很多优越的性能.支持向量机∞“o能够有效地处理高维数据,而且具有很好的泛化能力,文献[5~7]利用支持向量机作为统计降尺度方法来分析、预测降水和径流的变化,并用于月降水的预测与模拟.他们的研究表明相对于传统的神经网络模型.SVM对降水预测的结果精度更好,能够进一步在气候变化研究中推广应用.由于每个变量都在不同程度上反映着某些信息,而这些信息往往存在重叠现象.用主成分分析¨。能·收稿日期:2009
5、—02—10.基金项目:广西民族大学青年科研基金项目(2007QN23).作者简介:农吉夫(1975一),男(壮族),广西东兰人,广西民族大学数学与计算机科学学院讲师,从事概率统计及气象预报建模研究.89万方数据广西民族大学学报(自然科学版)2009年5月第15卷对原先提出的许多相关变量重新组合,得到一组新的、相互无关的综合变量,这些新的综合变量能够反映较多的信息.本文首先利用主成分分析法对研究范围内的预报因子进行主成分分析,得到各个主成分的数据序列,再采用支持向量机回归进行建模分析,得到广西区域5至6月日平均降水量的预测结果,并与逐步回归方法相比较.1
6、支持向量机算法支持向量机是Vapnik等人基于统计学习的VC维理论和结构风险最小化提出的一种新的通用学习方法.它通过利用有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,可获得较好的预测能力,能较好地解决小样本、非线性、高维数和局部极小点等实际问题,并且SVM仅需确定不敏感系数,惩罚因子以及核参数,建模比BP网络更简单,已成为机器学习界的研究热点之一,并成功地应用于分类和回归等方面.支持向量机回归有线性回归和非线性回归∽o,对于线性回归,考虑用线性回归函数:,(z)一W·z+b(1)设训练样本集D。由竹个样本(t,Y。)(i=1,2,3,⋯,竹)组
7、成,其中z;∈X,Yi∈R为最好估计,保证(1)式的平坦,必须寻找一个最小的硼,为此,采取最小化欧几里德空间的泛数,利用对偶原理、拉格朗日乘子法等技术,寻找最小W的问题。得线性回归函数厂(z)一芝:(口i—nj)(zi·z)+b(2)i=l其中ai、ai*为引入的拉格朗日乘子,式中的ai一口f不等于零对应的样本数据就是支持向量,所以线性回归可以表示为,(z)=≥:(口;一口?)(zi·z)+b(3)支再面量对于非线性支持向量机回归,其基本思想是通过一个非线性映射将数据映射到高维特征空间,并在这个空间进行线性回归.这样,在高维特征空间的线性回归问题就对应于
8、低维输入空间的非线性回归.其具体实现是通过核函数k(xi,zi)一垂(zi)垂(
此文档下载收益归作者所有