欢迎来到天天文库
浏览记录
ID:61956312
大小:2.61 MB
页数:61页
时间:2021-04-01
《第四讲-时间序列分析的预处理.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第四节时间序列数据的预处理一、动态数据的正态性检验二、动态数据的离群点三、动态数据的缺失值填充四、动态数据的平稳性检验五、动态数据的纯随机性检验1√√√获得观察值序列平稳性检验差分运算YN纯随机检验Y分析结束N拟合ARMA模型时间序列的预处理(续)1.平稳性定义——知识回顾若时间序列有有穷的二阶矩,且Xt满足如下两个条件:则称该时间序列为平稳序列。包括严平稳序列和宽平稳序列。四、平稳性检验在对实际的时间序列进行建模之前,应首先检验序列是否平稳,若序列非平稳,应先通过适当变换将其化为平稳序列,然后再进行模
2、型的建立。2.关于非平稳序列的处理序列的非平稳包括均值非平稳和方差非平稳。均值非平稳序列平稳化的方法:差分变换。方差非平稳序列平稳化的方法:对数变换、平方根变换等。3.平稳性检验方法非参数检验法特征根检验法单位根检验法(1)通过时间序列的趋势图来判断(2)通过自相关函数(ACF)判断图检验方法非参数检验法:游程检验一个游程定义为一个具有相同符号的连续串,在它前后相接的是与其不同的符号或完全无符号。例如,观察的结果用加、减标志表示,得到一组这样的记录顺序:++---+----++-+这个样本的观察结果共有
3、7个游程。(1)什么是游程(2)游程检验的基本思想如果符号序列是随机的,那么“+”和“-”将随机出现,因此它的游程数既不会太多,又不会太少;反过来说如果符号序列的游程总数太少或太多,我们就可以认为时间序列存在某种趋势性或周期性。a.小样本情况零假设H0:加号和减号以随机的方式出现检验方法:取显著性水平α(一般取0.05),查单样本游程检验表,得出抽样分布的临界值rL、rU判定:若rLrU或r4、样本情况零假设H0:加号和减号以随机的方式出现检验方法:给定显著性水平α(一般取0.05)查标准正态分布表,得出抽样分布的临界值-zα,+zα。并计算统计量:判定:若-zα5、“TestVariablelist”栏内4.选中“cutpoint”栏中“mean”选项5.单击“OK”按纽,开始进行统计分析。1.Analyze—NonparametricTests—Runs变量gnp进入“TestVariablelist”栏内选中“cutpoint”栏中“mean”选项→OK输出结果分析:因为P值(sig.)极大,所以不拒绝零假设,故不能拒绝原序列是平稳的。1)给出一个随机时间序列,首先可通过该序列的时间路径图(时序图)来粗略地判断它是否是平稳的。一个平稳的时间序列在图形上往往表现6、出一种围绕其均值不断波动的过程;而非平稳序列则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。时序图检验法这种方法通过观察时间序列的趋势图来判断时间序列是否存在趋势性或周期性。优点:简便、直观。对于那些明显为非平稳的时间序列,可以采用这种方法。缺点:对于一般的时间序列是否平稳,不易用这种方法判断出来。(1)时序图检验(判断准则)根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及无周期特征(2)自相关图检验7、(判断准则)平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。若时间序列的自相关函数在k>3时都落入置信区间,且逐渐趋于零,则该时间序列具有平稳性;若时间序列的自相关函数更多地落在置信区间外面,则该时间序列就不具有平稳性。若序列无趋势,但是具有季节性,那末对于按月采集的数据,时滞12,24,36……的自相关系数达到最大(如果数据是按季度采集,则最大自相关系数出现在4,8,12,……),并且随着时滞的增加变得较小。若序列是有趋势的,且具有季节8、性,其自相关函数特性类似于有趋势序列,但它们是摆动的,对于按月数据,在时滞12,24,36,……等处具有峰态;如果时间序列数据是按季节的,则峰出现在时滞4,8,12,……等处。应用举例例1时序图检验1951年——2005年我国居民住院消费价格指数的平稳性例2时序图检验1990年1月——1997年12月我国药品总产值序列的平稳性例1居民住院消费价格指数时序图平稳序列例2药品总产值时序图非平稳序列(1)选择菜单Graph→Sequence。绘制
4、样本情况零假设H0:加号和减号以随机的方式出现检验方法:给定显著性水平α(一般取0.05)查标准正态分布表,得出抽样分布的临界值-zα,+zα。并计算统计量:判定:若-zα5、“TestVariablelist”栏内4.选中“cutpoint”栏中“mean”选项5.单击“OK”按纽,开始进行统计分析。1.Analyze—NonparametricTests—Runs变量gnp进入“TestVariablelist”栏内选中“cutpoint”栏中“mean”选项→OK输出结果分析:因为P值(sig.)极大,所以不拒绝零假设,故不能拒绝原序列是平稳的。1)给出一个随机时间序列,首先可通过该序列的时间路径图(时序图)来粗略地判断它是否是平稳的。一个平稳的时间序列在图形上往往表现6、出一种围绕其均值不断波动的过程;而非平稳序列则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。时序图检验法这种方法通过观察时间序列的趋势图来判断时间序列是否存在趋势性或周期性。优点:简便、直观。对于那些明显为非平稳的时间序列,可以采用这种方法。缺点:对于一般的时间序列是否平稳,不易用这种方法判断出来。(1)时序图检验(判断准则)根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及无周期特征(2)自相关图检验7、(判断准则)平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。若时间序列的自相关函数在k>3时都落入置信区间,且逐渐趋于零,则该时间序列具有平稳性;若时间序列的自相关函数更多地落在置信区间外面,则该时间序列就不具有平稳性。若序列无趋势,但是具有季节性,那末对于按月采集的数据,时滞12,24,36……的自相关系数达到最大(如果数据是按季度采集,则最大自相关系数出现在4,8,12,……),并且随着时滞的增加变得较小。若序列是有趋势的,且具有季节8、性,其自相关函数特性类似于有趋势序列,但它们是摆动的,对于按月数据,在时滞12,24,36,……等处具有峰态;如果时间序列数据是按季节的,则峰出现在时滞4,8,12,……等处。应用举例例1时序图检验1951年——2005年我国居民住院消费价格指数的平稳性例2时序图检验1990年1月——1997年12月我国药品总产值序列的平稳性例1居民住院消费价格指数时序图平稳序列例2药品总产值时序图非平稳序列(1)选择菜单Graph→Sequence。绘制
5、“TestVariablelist”栏内4.选中“cutpoint”栏中“mean”选项5.单击“OK”按纽,开始进行统计分析。1.Analyze—NonparametricTests—Runs变量gnp进入“TestVariablelist”栏内选中“cutpoint”栏中“mean”选项→OK输出结果分析:因为P值(sig.)极大,所以不拒绝零假设,故不能拒绝原序列是平稳的。1)给出一个随机时间序列,首先可通过该序列的时间路径图(时序图)来粗略地判断它是否是平稳的。一个平稳的时间序列在图形上往往表现
6、出一种围绕其均值不断波动的过程;而非平稳序列则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。时序图检验法这种方法通过观察时间序列的趋势图来判断时间序列是否存在趋势性或周期性。优点:简便、直观。对于那些明显为非平稳的时间序列,可以采用这种方法。缺点:对于一般的时间序列是否平稳,不易用这种方法判断出来。(1)时序图检验(判断准则)根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及无周期特征(2)自相关图检验
7、(判断准则)平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。若时间序列的自相关函数在k>3时都落入置信区间,且逐渐趋于零,则该时间序列具有平稳性;若时间序列的自相关函数更多地落在置信区间外面,则该时间序列就不具有平稳性。若序列无趋势,但是具有季节性,那末对于按月采集的数据,时滞12,24,36……的自相关系数达到最大(如果数据是按季度采集,则最大自相关系数出现在4,8,12,……),并且随着时滞的增加变得较小。若序列是有趋势的,且具有季节
8、性,其自相关函数特性类似于有趋势序列,但它们是摆动的,对于按月数据,在时滞12,24,36,……等处具有峰态;如果时间序列数据是按季节的,则峰出现在时滞4,8,12,……等处。应用举例例1时序图检验1951年——2005年我国居民住院消费价格指数的平稳性例2时序图检验1990年1月——1997年12月我国药品总产值序列的平稳性例1居民住院消费价格指数时序图平稳序列例2药品总产值时序图非平稳序列(1)选择菜单Graph→Sequence。绘制
此文档下载收益归作者所有