资源描述:
《实现影响因素多源异构融合的短期负荷预测支持向量机算法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第40卷第15期2016年8月10日Vol.40No.15Aug.10,2016DOI:10.7500/AEPS20160229012实现影响因素多源异构融合的短期负荷预测支持向量机算法吴倩红1,高军2,侯广松2,韩蓓1,汪可友1,李国杰1(1.电力传输与功率变换控制教育部重点实验室(上海交通大学),上海市200240;2.国网山东省电力公司菏泽供电公司,山东省菏泽市274000)摘要:针对智能电网大数据环境下,导致电力系统负荷波动的诸多因素存在多源异构性的问题,利用多核函数来对其多源异构特性进行差异化处理和融
2、合,能够描述影响因素的内在分布特性并应对其变化,提高负荷预测精度.选取历史负荷、气温、气压、相对湿度、降雨量、风向、风速、节假日及电价9个属性作为多源异构影响因素,利用样本特征分布法、单变量法及核矩阵秩空间差异法来选择多核函数的构成,采用双层多核学习算法,建立了并行化多核支持向量机(SVM)负荷预测算法流程,并在Hadoop集群上进行了仿真验证.仿真结果表明,多核SVM比单核SVM预测平均相对误差小,双层多核学习、基于l范数的多核SVM模型预测精度最高.因此,多核SVM能有效p处理负荷预测中的多源异构数据,经并
3、行化处理后,能提高负荷预测的速度与精度.关键词:大数据;多源异构特性;支持向量机(SVM);负荷预测;并行化0引言提高预测精度具有重要意义.大数据环境下,现有的负荷预测方法如时间序[1]随着智能电网研究的不断深入,高级管理体[7G8][9][10G12]列、回归分析、神经网络、支持向量机[2]系逐步建立,智能用电设备逐渐推广,在这一过程[13G15](SVM)等在运算速度和考虑负荷影响因素的[3]中积累了大量的基础用电数据,同时分布式电源、多源异构性方面存在局限性.在运算速度方面,当储能、电动汽车等多种新型用电
4、形式出现,各类先进数据量非常大时,现有负荷预测方法速度很慢,比如理念和技术不断出现,社会对供电服务的需求日趋[4]神经网络和模糊理论均需要较长的训练时间.在考多样化,因此影响负荷预测的因素数量、种类、随虑负荷影响因素多源异构特性方面,经典时间序列机性以及分布特点等日益多而复杂,传统的负荷预法对负荷影响因素考虑较少,大多只利用历史负荷测方法的速度与精度已经不能满足大数据环境下的进行预测;回归分析方法虽然考虑了部分影响因素,要求.但并没有考虑影响因素的异构特性,未能对这些特智能电网大数据具有分散性、多样性、复杂性以
5、[5]征进行区分对待;现有SVM大多是基于单核进行及高价值的特点,前三个特点使得大数据具有多负荷预测,其将所有的特征都并列堆叠成一个向量,源异构特性.所谓多源异构性是指在数据管理和访而后一起输入到一个具有固定形式与固定参数的单问中存在异构性问题,如系统异构、数据源异构等.一核函数中进行建模,无法处理负荷影响因素来自影响负荷预测的因素包括历史负荷数据、气象数据不同数据源的不同种类特征.(气温、降雨量、气压、相对湿度、风向、风速等)、地理目前已有一些文献对大数据环境下负荷预测速数据、节假日数据、电价等.这些因素各自
6、治系统的度的提高做了研究.文献[16]提出基于随机森林算建设时间、研发单位、采用的技术和具体业务的特定法的并行负荷预测方法,缩短了负荷预测时间,提高要求等,导致了数据的存储方式、数据类型以及更新[6]了随机森林算法对大数据的处理能力;文献[17]基频次的不同,因而具有多源异构的特点.如何基于局部加权线性回归和云计算平台,建立并行局部于负荷影响因素的多源异构特性进行负荷预测,对加权线性回归模型,提高了预测速度.以上文献都是从运算速度方面对负荷预测算法进行改进,但从收稿日期:2016G02G29;修回日期:2016
7、G05G03.上网日期:2016G07G12.考虑负荷影响因素多源异构特性方面来提升负荷预国家自然科学基金资助项目(51407116);国家科技支撑计划测精度的研究还很少,文献[13]采用两个不同尺度资助项目(2015BAA01B02).的高斯核函数进行负荷预测,但多分辨率核函数是http://www.aepsGinfo.com672016,40(15)?学术研究?靠经验构建,且两个核函数是简单相加.局部核函数和全局核函数的内推与外推能力存在差目前文献中关于多核函数构成选择的方法,主异,若将两者组合成新的多核函
8、数,则能够扬长避要有两种:第一种是直接选取一个全局核函数短,兼顾其构成中的普通核函数的优势,得到性能更[19]Kglobal和一个局部核函数Klocal,构成混合核函数加优良的SVM预测模型.K3=λKglobal+(1-λ)Klocal,其中权重λ∈[0,1],这1.0σ0.050.78σ0.15σ0.25种方法没有考虑已有数据集的特征,且常用的全局0.8σ0.350.77σ0.4