欢迎来到天天文库
浏览记录
ID:42609293
大小:248.00 KB
页数:4页
时间:2019-09-18
《支持向量机用于预测短期用水量》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、支持向量机用于预测短期用水量摘要:针对基于经验风险最小化的神经网络存在模型结构较难确定和过学习的问题,根据时用水序列周期性和趋势性的特点,提出了基于支持向量机(SVM)的时用水量预测模型。SVM通过引进参数代替不敏感系数,有效地控制支持向量个数。实例分析结果表明,与基于BP网络的预测模型相比,基于SVM的时用水量预测模型建模速度更快,预测精度更高。关键词:支持向量机;供水系统;时用水量预测Short-termwaterdemandforecastusingsupportvectormachineAbs
2、tract:Empiricalriskminimization(ERM)-basedneuralnetworksuffersdrawbackslikethechoiceofthetopologystructureandoverfiting.Accordingtotheperiodicityandtrendofwaterdemandseries,anhourlywaterdemandforecastmodelbasedonsupportvectormachine(SVM)wasproposed.Byre
3、placingtheinsensitiveparameterwithaparameter,SVMcaneffectivelycontrolthenumberofsupportvector.CasestudyshowsthatthemodelingspeedofSVM-basedhourlywaterdemandpredictionmodelisfasterandtheforecastprecisionishigherthanthoseofBPneuralnetwork-basedmodel. Keyw
4、ords:supportvectormachine;waterdistributionnetwork;hourlywaterdemandforecast根据统计学习理论[1],为了控制模型的泛化能力,需同时考虑经验风险最小化和置信范围两个因素。神经网络基于经验风险最小化,它仅强调经验风险最小化(训练误差最小),而不考虑最小化置信范围,因此极易产生过学习问题,导致泛化能力较差。此外,网络结构较难确定,并且样本数目趋于无穷大的假设在实际中往往得不到满足,使神经网络难以较好用于实际预测[2]。在严格的理论推
5、导下,Vapnik提出了针对小样本学习的基于VC维和结构风险最小化的新型学习机器——支持向量机。与神经网络相比,支持向量机不仅不存在局部极小和维数灾问题,而且折衷考虑经验风险和置信区间,使模型具有较强的泛化能力。此外,用于回归估计的SVM仅需不敏感系数、惩罚因子以及核函数宽度系数(采用径向基核函数)三个参数,建模比BP网络更简单。目前,用于回归估计的SVM在计算前需确定不敏感系数,通过来控制回归估计精度,但是如何选择适当的以实现高精度估计却非常困难。为此,本文采用Schlokopf提出的SVM算法[2
6、],通过引进一个新的参数来自动选择的大小,以控制支持向量的数目和训练误差的大小。1、用于回归估计的SVM算法给定个训练样本,其中:为维的训练样本输入,为训练样本输出,要求拟合的函数为:(1)其中:为权矢量;为偏置量;为核空间映射函数,将输入样本从输入空间映射到特征空间。所求的拟合函数使下面的目标函数(结构风险)最小:(2)其中:是调节系数,用于调整模型复杂化和训练误差之间的比例;训练误差,可用-不敏感损失函数来度量:(3)预先确定非常困难,因此可引进一个新的参数来自动选择的大小。这样,函数拟合问题转化
7、成如下优化问题:(4)其中:为松驰系数。通过求解以上优化问题,得到对偶问题:(5)其中:为核函数。由KKT条件,在最优点满足(6)对于边界支持向量BSV,,因此对于个边界支持向量,有,即;而对于支持向量SV,有,因此对于个支持向量,有,因此有(7)由上式可知,可控制支持向量个数或错分样本数,并且的取值范围为[0,1]。最后得到SVM的输出函数为:(8)其中:一般取径向基核函数,即。2、SVM用于预测时用水量[4]根据时用水负荷周期性和趋势性的特点,为预测某一时刻给水管网的时用水量,模型的输入取前一天该
8、时刻的管网时用水量,前一周该时刻的管网时用水量。将得到的时用水量数据分为576组训练验证集和48组测试集,为了真实反映模型的预测能力,48组测试集由1工作日和1休息日的时用水量数据构成。建模和预测过程如下:①对训练验证集的训练集数据、验证集的输入数据进行预处理,使均值为0,方差为1,对模型预测数据进行反预处理。②通过试算,取0.4。对模型参数和采用交叉验证来确定,的寻优范围取[0.01,1000],的寻优范围取[1,1000]。交叉验证步骤为:将576组
此文档下载收益归作者所有