资源描述:
《统计预测与决策论文(终稿)》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
各种预测模型在全国能源消耗总量中的应用091124104丁灯摘要:能源影响着我国社会经济的稳定持续发展,对未来能源消耗的准确预测具有重要的意义。木文以我国1978-2008年的全国能源消耗总量数据为基础,建立了ARIMA预测模型、灰色预测模型、三次多项式预测模型和基于这三种模型的组合模型,并进行了精度比较,最后选择最优的组合预测模型对2009-2011年的全国能源消耗总量进行预测。关键词:ARIMA模型;灰色预测模型;三次多项式;组合模型;能源消耗1引言:能源是国民经济发展和人民生活水平提高的重要物质基础,能源短缺曾经长期制约我国经济的发展。近儿年由于能源工业的发展,短缺局面虽然得到了缓解,但从长远来看能源供需形势仍然非常严峻,因此做好未來能源消费预测分析,为能源规划及政策的制定提供科学的依据,对于保持我国社会经济健康、持续、稳定发展具有重要的理论与现实意义。本文利用《屮国统计年鉴》得到31期全国能源消耗总量y的时间序列如下表一所示:表一:全国能源消耗总量(单位:万吨标准煤)年份197819791980198119821983198419851986y571445858860275594476206766040709047668280850年份198719881989199019911992199319941995y86632929979693498703103783109170115993122737131176年份199619971998199920002001200220032004y138948137798132214133831138552.6143199.2151797.3174990.3203226.7年份2005200620072008y224682246270265583285000 2预测方法介绍2.1ARIMA模型的基本原理ARIMA模型是Box和Jenkinsl970年提出的以随机理论为基础的时间序列分析方法,乂称为"Box-Jenkins模型”,这以模型在经济领域的预测分析中得到了广泛的应用。时间序列是依赖时间t的一组随机变量,构成该时序的单个序列值虽然具有不确定性,但对整个时间序列来说,它的变化却有一定的规律性,可以用和应的数学模型来近似描述。ARIMA模型有三种基木类型:自冋归模型、移动平均模型、单整自凹归移动平均模型。单整是指将一个时间序列有非平稳性变为平稳性所要经过的差分的次数,这是对非平稳时间序列进行时间序列分析的必经步骤。假设一个随机过程含有d个单位根,其经过d次差分之后可以变换为一个平稳的口回归移动平均过程。则该随机过程称为单整自冋归移动平均模型。模型中AR称为口冋归分量,P为口回归分量的阶数;MA为移动平均分量,q为移动平均分量的阶数;I为差分,d为使时间序列具有平稳性所需要的羌分次数。p阶自凹归过程AR(p)的一般表达式为:X,=(p}Xt_}+(p2X{_2+•••+^Xt_p+其屮“白噪声过程。q阶的移动平均过程MA(q)可以表示为:X[=--q9吕为白噪声过程。ARIMA(p,d,q)模型一般表达式为:Xf=0()+0IX_]+©X一2+•••+QpX—p+£—&]£_]_&2^-2OqS-q 2.2灰色预测法灰色预测法是一种对含有不确定因素的系统进行预测的方法。一般是利用时间序列数据,通过建立GM(1,1)模型进行预测。灰色预测模型的预测步骤如下:(1)首先对原始时间序列数据兀⑼,做一次累加生成,得到新的序列兀⑴(2)利用一次累加生成序列拟合微分方程:—+做⑴二“,得到参数。dt和“(3)解微分方程得到预测模型函数:X'⑴伙+1)=[X®(1)-上]厂火+上aa(4)将得到的X’⑴序列进行一次累减得到预测序列X®(5)利用历史数据对数据模型进行精度检验,若通不过检验,则利用残差对原模型进行修正。(6)通过预测方程进行预测。2.3组合预测模型不同的预测方法根据相同的信息,往往会提供不同的结果,如杲简单的将误差较大的一些方法舍弃掉,将会丢弃一些有用的信息,使得模型的精度不高。组合预测法是指通过建立一个组合预测模型,把多种预测方法所得到的预测结果进行综合。由于组合模型能够较大限度地利用各种预测样木信息,所以它比单项预测模型考虑问题更系统、更全面,因而能够有效地减少单个预测模型受随机因素的影响,可以提高预测的精度和稳定性。3全国能源消耗总量的实证分析3.1建立ARIMA模型3.11平稳化处理用ARIMA模型拟合的时间序列必须是平稳的,如果序列不平稳,则要通过差分或序列变换等先将序列平稳化。绘制原始序列的时序图得到图形如图一所 示:Y300,000250,000200,000150,000-100,000-1980198519901995200020052010图一:y时序图由图可从直观上看出原始序列存在明显的长期递增趋势,原始序列不平稳。利用软件EViewsG.0,运用单位根检验方法对序列进行平稳性检验发现原始序列确定不平稳,因此木文先对该序列取对数,令y/=log(y),然后对yl进行差分,差分两次之后得到平稳的序列ylii。单位根检验结果如卜•表二所示:表二:单位根检验结果ADF值P值临界值a=l%临界值a二5%临界值a=10%原始序列y1.7585820.9995-3.68919-2.97185-2.62512取对数后yl0.6275170.988-3.68919-2.97185-2.62512一阶差分yli-2.958250.0529-3.72407-2.98623-2.6326二阶差分ylii-4.765430.0007-3.69987-2.97626-2.62742由表可知,取对数后再做两次一步差分Z后的序列yliiADF检验的P值为0.0007,小于0.05, 因此拒绝序列非平稳的原假设,可以接受序列为平稳的备择假设。在此可知ARIMA模型定阶为d=2。也可由图标直观说明序列的平稳性,作出ylii的时序图如图一所示:YLII.10|.08-.06-.04-.02-.00--.02--.04--.06--08.|||||||||•22IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII1980198519901995200020052010图二:ylii时序图时序图也显示ylii序列平稳,结果与单位根检验相符。3.12模型定阶模型定阶的方法有多屮,木文选择基于自相关函数和偏自相关函数的定阶方法确定模型的阶数。首先,考察平稳序列ylii的口相关图和偏口相关的性质,为 拟合模型定阶,自相关函数(ACF)和偏自相关函数(PACF)图形如图三所示;图三:ACPACQ-StatProbAutocorrelationPartialCorrelation1ICZ1111IEZJ111111]1111J111匚11匚111111111匚11=111】11■11111[1|D11]1111]11匚110.1050.1050.35710.5502-0.308-0.3233.51280.1733-0.0330.0503.55030.31440.059-0.0483.67470.4525-0.211-0.2375.34280.3756-0.413-0.41112.0160.0627-0.046-0.16012.1030.09780.3000.04515.9480.04390.1420.03716.8570.05110-0.088-0.09217.2210.070110.097-0.00617.6880.089120.079-0.18918.0200.115由图形可知,对处理后的序列ylii可以选择建立ARIMA(1,2,1)、ARIMA(1,2,2)、ARMA(2,2,1).ARTMA(2,2,2)4种模型。分别拟合这四种模型得到结果如表三所示:表三:4种模型拟合结果模型变量估计系数T统计量伴&概率P值调整FAICSCARIMA(1,2,1)AR⑴-0.37510-1.228110.230400.17179-4.13804-4.04288MA(1)0.745243.238980.00330ARIMA(1.2,2)AR⑴0.326321.534930.137400.27357-4.23696-4.09422MA⑴-0.25253-1.742640.09370MA(2)-0.73255-5.340260.00000 ARIMA⑵2,1)AR(1)AR⑵MA(1)-0.25552-0.234720.59424-0.95215-1.227332.305320.350500.231600.030100.18863-4.15745-4.01347ARIMA(2,2,2)AR⑴-0.76684-5.246990.000000.28900-4.25798-4.06601AR⑵-0.59005-3.948570.00060MA(1)1.2465320.409940.00000MA⑵0.9265920.036340.00000其屮只有ARIMA(2,2,2)模型的各系数通过了显著性检验,而且其模型的调整F是四个模型屮最大的,虽然它的AIC,SC的绝对值不是最小的,ARIMA(1,2,1)模型的AIC最小,ARIMA(2,2,1)的SC最小,但它们的系数都没有通过显著性检验,而且调整疋也较小,所以本文选择ARIMA(2,2,2)模型,模型表达式为:ylii1=(1-B)(l-B)log(y)=(1-1.24653B-0.92659^2)^1+0.76684B+0.59005B23.13模型检验用ARIMA(2,2,2)模型做拟合得到残差序列耳,对残差序列进行自相关和偏自相关分析,得到结果如图三所示: AutocorrelationPartialCorrelationACPACQ-StatProb111]11=]111111]11【11C1|EZ11EZ1|CZZ1|U1|11I1I1I111ZJ11|[1]1111匚厂厂11110.0420.0420.054120.1980.1971.324730.0680.0551.47994-0.025-0.0711.50265-0.203-0.2373.01160.0836-0.295-0.3026.32490.0427-0.0330.0656.36740.09580.2360.4918.69920.0699□0120.1628.70600.1211O□037-0.3378.77090.18711-0.043-0.7248.86030.26312□055-0.4689.01840.341图三由图可知。残差序列P值儿乎都是大T0.05的,说明残差序列近于白噪声,基木没有可提取的信息了,模型已经提取了有规律的信息,说明模型拟合效果较好。3.14模型预测利用1978-2008年的时间序列建立的ARMA(252,2)模型:厂=(l_B)(l_B)log(y)=(1-1.246533-0.92659肝冏1+0.76684B+0.59005矿来预测2004-2010年的能源消耗总量,结果如表四所示:表四:2004-2010年全国能源消耗总量ARIMA(2,2,2)模型预测值年份2004.002005.002006.002007.002008.()02009.002010.002011.00实际值203226.68224682.00246270.00265583.00285000.00预测值202971.88233243.50268974.47311049.59358189.95413129.35477104.00549931.36绝对相对误差百分比(%)0.133.819.2217.1225.683.2灰色模型预测 根据历史数据序列?0),做一次累加得到生成序列兀⑴,对于微分方程竽+卅j,构造数据矩阵B和数据向量Y,解该微分方程,得到『讪其中:X⑴(1)+X⑴⑵X(o)⑵y=X(o)(3)•••X(o)(31)2X⑴(2)+X⑴(3)2■X⑴(30)+X⑴(31)进行审阵运算得到发展灰数a=-0.055673,内生控制灰数//=45508.908,得到预测模型为:X⑴'伙+1)=874576.3严阿-817432.3。3.21残差检验将得到的序列进行一次累减生成预测序列X(0)t,将预测值与真实值比较得到绝对误差序列弓为:A⑼二{0、8516.84、7337.171、3478.379、2894.069>3479.306、4761.587>6752.808、6917.228、8466.436>10356.31>9561.971>6328.756、6120.155、5915.771、6827.269、7321.323、9152.556、9938.481>1402.44、11990.47、18629.48、22636.52、27218.27、28376.96、15499.22、1831.269、11756.32、21153.92、27578.59>33369.39}计算相对误差后发现其屮有些较大,甚至大于10%,最后五项的平均相对误差为7.36319507%。残差检验没有通过,下面进行关联度检验。当p=0.5时,关联度大于0.6时就可以通过关联度检验了。由残差的绝对序列可知min(A(°))=0,max(A(0))=33369.39。然后根据公式0伙)=凹疇上空豎孵1q=i,2,…,q=0.5)计算每个序列值的关联系数,A/}+pmax{A?J} 再求平均得到关联度=0.650237。木文取取p=0.5,「>0.6,因此模型通过了关联度检验。虽然模型通过了关联度检验,但模型没有通过残差检验,精度不够理想,所以木文对该模型进行残差修正。3.22模型修正根据模型得到的残羞序列弓,去掉第一项得到新的序列刃),然后进行累加得到序列e⑴,在此基础上建立相应的GM(1,1)模型:严伙+1)=[严⑴-纠严,模型两边求导得到残差修正项为:叫Ue[严伙+1)]'=(-乞)[严⑴-勻严*o原预测模型加上此修正项得到修正后的预测模型为:X'⑴伙+1)=[X⑼(1)-^eak+出+5伙-1)(-乞)[严(1)-纠严,其中aaue为修正系数。最后进行累减得到原始序列预测模型:X®伙+1)=X'⑴伙+1)-X'⑴伙)。根据所得数据,利用Excel软件,得到匕=-0.06924,ue=2893.212。根据修正项的计算公式,可得[e(1)^+l)|=-3482.92e006924A,这样经过残差修正后的模型为:X'⑴伙+1)=874576.3严血73j8】7432.3+5伙-1)(-3482.92)严曲其中^-l)=r^-2L在此序列的基础上进行累减得到2004-2011年的全国能源消 ,k<2耗总量的预测值如卜•表五所示: 年份20042005200620072008200920102011实际值203226.7224682246270265583285000预测值201439.6212966.946225154.6238040.3251664.1266068.2281297.3297398.4相对误差白分比(%)0.875.218.5710.3711.693.3三次多项式当预测对象依时间变化呈现某种上升或下降的趋势,并且无明显的季节波动,又能找到一条合适的函数1山线反应这种变化趋势时,就可用时间t为自变量,时序数值y为因变量,建立趋势模型:y=f⑴。三次多项式预测模型是趋势外推预测模型屮的一种比较常用的模型。为了探究时序数据变化的趋势,作出全国能源消费总量y的散点图如图四所示:全国能源消耗总量♦系列1图四:散点图 的趋势上升,但经过精度比较Z后,三次多项式的拟合的最好,所以本文采用三次多项式模型进行拟合。利用软件Eviews进行回归得到结果如下表六所示:表六:三次多项式模型结果变量系数标准差T统计量P值常数项34209.538549.9254.0011500.0004T10136.882277.3004.4512700.0001TA2-646.4941163.9748-3.9426440.0005TA318.582983.3716555.5115310.0000其中模型的F统计量为345.9252,相伴概率为0.00,小于0.05,所以拒绝原假设,即模型是显著的。而且齐系数的显著性检验的P值都小于0.05,通过了显著性检验。模型的调整的疋为0.971825,接近于1,说明模型拟合效果好。因此,建立三次多项式模型如下:y=18.583?-646.494尢2+10136.88兀+34209.53用该模型对2004-2011年的全国能源消费总量进行预测得到结杲如表七所示:表七:2004-2011年全国能源消费总量三次多项式预测值年份20042005200620072008200920102011真实值203226.7224682246270265583285000预测值202380.4219124.89237698.4258212.3280778.2305507.6332511.9361902.6相对误差百分比(%)0.412.473.482.771.483・4组合模型 以上三种方法有些精度较高,有些精度较低,但由于各自理论的缺陷,会使预测产生系统偏差。为了更充分的提取样木信息,提高预测精度,木文将以上三种预测模型进行组合得到一个纽•合的预测模型。纽•合模型的权重有多种,可以等概率取权重,可以采用最小二乘估计法取权重,也可以使权重m1=1亠,其中5为残差标准差,m-1m为单一模型的个数,或者使权重t”/=!其中为第i个单一模型误差平方和,m为单一模型个数。本文采用第三种取取权重的方法,即工0-5m/=!利用Excel软件求得权匣分别为:w严0.466858,vv2=0.171932824,vv3=0.361209557根据预测模型:yt=吗儿+MH+叫)久对2004・2011年的全国能源消耗总量进彳亍预测结果如下表八所示:表八:2004-2011年全国能源消耗总虽组合预测值年份20042005200620072008200920102011真实值203226.68224682246270265583285000预测值202142.34219328.12238544.92260010.57283571.66309765.5338872.9370931.5相对误差百分比(%)0.532.383.132.090.504模型精度比较及预测 对误差百分比,其计算公式为:1v—V1平均绝对相对误差百分比(MAPE-V匕一xlOO%各种方法预测结果的精度见表九。表九:四种方法预测结果的平均绝对相对误差方法ARIMAC2,2,2)灰色模型三次多项式组合模型平均绝对相对误(MAPE)11.19%7.34%2.12%1.73%由表可知,在三个单一的预测模型中,三次多项式预测模型的平均绝对相对误丼最低为2.12%,预测精度最高。组合预测模型结合了单一预测模型的优势,其精度大大提高,平均绝对相对误差白分比为1.73%,是四种预测模型中最低的。因此本文采用组合预测模型往后作三期预测,得到2009-2010年全国能源消耗总量的预测值如表十所示:表I•:2009-2010年全国能源消耗总量预测值年份200920102011预测值309765.54338872.92370931.545结论通过对全国能源消耗总量的实例分析,发现基TAR1MA预测模型、灰色模型和三次多项式的预测模型的组合模型的精度最高,组合模型较大限度地利用各种预测样木信息,考虑问题更系统、更全面。因此,利用组合模型对全国能源消耗总量进行预测,为能源规划及政策的制定提供科学的依据。参考文献[1]中国国家统计局中国统计年鉴2009[2]徐国祥编著•统计预测与决策•上海财经大学出版社,2009[3]刘勇,汪旭辉.ARIMA模型在我国能源消费预测中的应用.经济经纬.2007,(5)[4]潘志刚,韩颖.纽•合预测法在我国汽车市场需求预测屮的应用•商业研 究.2006,(20)