欢迎来到天天文库
浏览记录
ID:30308319
大小:224.62 KB
页数:11页
时间:2018-12-28
《r语言进行arima分析报告》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、R学习日记——时间序列分析之ARIMA模型预测今天学习ARIMA预测时间序列。 指数平滑法对于预测来说是非常有帮助的,而且它对时间序列上面连续的值之间相关性没有要求。但是,如果你想使用指数平滑法计算出预测区间,那么预测误差必须是不相关的,而且必须是服从零均值、方差不变的正态分布。即使指数平滑法对时间序列连续数值之间相关性没有要求,在某种情况下,我们可以通过考虑数据之间的相关性来创建更好的预测模型。自回归移动平均模型(ARIMA)包含一个确定(explicit)的统计模型用于处理时间序列的不规则部分,它也允许不规则部分可以自相关。首先,先确定数据的差分。ARIMA模型为平稳
2、时间序列定义的。因此,如果你从一个非平稳的时间序列开始,首先你就需要做时间序列差分直到你得到一个平稳时间序列。如果你必须对时间序列做d阶差分才能得到一个平稳序列,那么你就使用ARIMA(p,d,q)模型,其中d是差分的阶数。 我们以每年女人裙子边缘的直径做成的时间序列数据为例。从1866年到1911年在平均值上是不平稳的。随着时间增加,数值变化很大。 >skirts<-scan("http://robjhyndman.com/tsdldata/roberts/skirts.dat",skip=5)Read46items>skirtsts<-ts(skirts,start=
3、c(1866)) >plot.ts(skirtsts)我们可以通过键入下面的代码来得到时间序列(数据存于“skirtsts”)的一阶差分,并画出差分序列的图:>skirtstsdiff<-diff(skirtsts,differences=1) >plot.ts(skirtstsdiff)从一阶差分的图中可以看出,数据仍是不平稳的。我们继续差分。>skirtstsdiff2<-diff(skirtsts,differences=2)>plot.ts(skirtstsdiff2)二次差分(上面)后的时间序列在均值和方差上确实看起来像是平稳的,随着时间推移,时间序列的水平和方
4、差大致保持不变。因此,看起来我们需要对裙子直径进行两次差分以得到平稳序列。第二步,找到合适的ARIMA模型 如果你的时间序列是平稳的,或者你通过做n次差分转化为一个平稳时间序列,接下来就是要选择合适的ARIMA模型,这意味着需要寻找ARIMA(p,d,q)中合适的p值和q值。为了得到这些,通常需要检查[平稳时间序列的(自)相关图和偏相关图。 我们使用R中的“acf()”和“pacf”函数来分别(自)相关图和偏相关图。“acf()”和“pacf设定“plot=FALSE”来得到自相关和偏相关的真实值。 >acf(skirtstsdiff2,lag.max=20) >acf
5、(skirtstsdiff2,lag.max=20,plot=FALSE)Autocorrelationsofseries‘skirtstsdiff2’,bylag 0 1 2 3 4 5 6 7 8 9 10 1.000-0.303 0.096 0.009 0.102-0.453 0.173-0.025-0.039 0.073-0.094 11 12 13 14 15 16 17 18 19 20 0.133-0.089
6、-0.027-0.102 0.207-0.260 0.114 0.101 0.011-0.090 自相关图显示滞后1阶自相关值基本没有超过边界值,虽然5阶自相关值超出边界,那么很可能属于偶然出现的,而自相关值在其他上都没有超出显著边界,而且我们可以期望1到20之间的会偶尔超出95%的置信边界。 >pacf(skirtstsdiff2,lag.max=20)>pacf(skirtstsdiff2,lag.max=20,plot=FALSE)Partialautocorrelationsofseries‘skirtstsdiff2’,bylag 1 2
7、 3 4 5 6 7 8 9 10 11 -0.303 0.005 0.043 0.128-0.439-0.110 0.073 0.028 0.128-0.355 0.095 12 13 14 15 16 17 18 19 20 0.052-0.094-0.103-0.034-0.021-0.002 0.074 0.020-0.034 偏自相关值选5阶。故我们的ARMIA模型为armia(1,2,5)>skir
此文档下载收益归作者所有