基于支持向量机回归中国cpi预测探究

基于支持向量机回归中国cpi预测探究

ID:5606279

大小:31.00 KB

页数:9页

时间:2017-12-19

基于支持向量机回归中国cpi预测探究_第1页
基于支持向量机回归中国cpi预测探究_第2页
基于支持向量机回归中国cpi预测探究_第3页
基于支持向量机回归中国cpi预测探究_第4页
基于支持向量机回归中国cpi预测探究_第5页
资源描述:

《基于支持向量机回归中国cpi预测探究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于支持向量机回归中国CPI预测探究  摘要:本文针对中国CPI指数的预测问题,首先用主成分分析方法对影响CPI指数的八个指标进行降维处理,然后利用支持向量机技术建立起中国CPI指数的预测模型并对我国实际的CPI指数进行了预测。实证分析结果表明,PCA-SVM模型能够有效地对CPI指数进行短期预测。最后,与单纯的支持向量机模型的预测结果做了对比,对比结果表明,支持向量机和主成分分析相结合的模型应用于CPI预测具有较高的精确度。关键词:CPI;支持向量回归机;主成分分析一、引言居民消费价格指数也称消费者价格指数(Cons

2、umerPriceIndex,CPI),是反映一定时期内城乡居民所购买的生活消费品和服务项目价格变动趋势和幅度的指数,是反映通货膨胀水平的重要指标和根据。这一指数与居民的经济生活有着密切的关系,它衡量的是生活消费品和服务项目的价格变动对居民实际生活支出的影响程度,在各级政府研究和制定货币、价格、工资、消费、社会保障政策及进行国民经济核算等方面,发挥着很重要的作用。过高或过低的CPI指数都不利于国民经济的健康发展,因此对CPI的预测具有很重要的现实意义,它关系到国家宏观经济调控的政策取向。9目前文献在CPI指数预测方面,

3、主要采用传统统计方法和建模方法。传统的统计方法包括协整回归预测模型、ARIMA预测模型、自回归模型等,建模方法主要有神经网络模型等。本文提出了基于支持向量机(SupportVectorMachine,简称SVM)的中国CPI预测模型并对我国CPI指数进行预测。SVM作为一种机器学习方法,是由Vapnik最先提出。它以统计学习理论和结构风险最小化原则为基础,能够克服神经网络局部最优值等问题。支持向量机能够很好地处理非线性数据问题,近几年,在模式识别、数据挖掘和时间序列数据预测等方面得到了成功的应用,但是应用于我国CPI指

4、数的预测并不多见。本文首先采用主成分分析法对数据进行降维处理,然后将支持向量机回归方法应用于我国CPI的短期预测。预测结果表明利用主成分分析方法不仅能够加快SVM的训练速度,还能提高预测精度。二、理论分析(一)支持向量机回归模型给定训练集(xi,yi),i=1,2...,N,其中N表示N个训练样本,xi表示输入向量,yi表示相对应的输出变量。则回归函数可表示为y=f(x)=ωT?覬(x)+b,其中?覬(x)输入空间到高维特征空间的非线性映射。求解系数ωT和b,根据经验风险最小化原则,使得函数R(f)=C■L(f(xi)

5、-yi)+■

6、

7、ω

8、

9、29最小化,其中,L(●)表示损失函数,C为惩罚因子。这里所说的损失函数是指常用的ε不敏感损失函数。问题就转化为以下优化问题■■

10、

11、ω

12、

13、2+C■(ξi+ξ*i)s.t.yi-(ωT?覬(xi)+b)≤ε+ξi(ωT?覬(xi)+b)-yi≤ε+ξ*iξi,ξ*i≥0,i=1,2...N.其中,ξi,ξ*i分别表示目标值上下限的松弛变量。目标函数中,既要使得■

14、

15、ω

16、

17、2最小化,又要使得■((ξi+ξ*i))最小化,即松弛变量最小,为了综合考虑这两个目标,引入了惩罚因子C>0,它反映了对■

18、

19、ω

20、

21、

22、2最小化和松弛变量最小化的重视程度。引入拉格朗日函数,得到其对偶优化问题■=-■■(ai-ai*)(aj-aj*)K(xi,xj)-ε■(ai+ai*)+■yi(ai-ai*)s.t.■ai=■ai*,0≤ai,ai*≤C.其中ai,ai*是拉格朗日乘子向量。解此优化问题,若得到的ai*≠ai,则称与其对应的训练点(xi,yi)为支持向量,否则称为非支持向量。得到的回归函数为f(x)=■(ai-ai*)(?覬(xi)·?覬(x))+b=■(ai-ai*)K(xi,x)+b9其中,K(xi,xj)=(?覬(xi)·?覬

23、(xj))是满足Mercer条件的核函数。核函数有线性核函数、多项式核函数、sigmoid核函数和径向基核函数,通常使用的核函数是径向基核函数。由于在以往的研究中,应用径向基核函数能取得很好的效果,因此本文使用径向基核函数K(x,x′)=exp(-

24、

25、x-x′

26、

27、2/2σ2),σ>0在支持向量机模型的应用过程中,需要确定的参数包括惩罚因子C、核函数、核参数、损失函数的参数。参数的选择对于支持向量机模型的预测精度有很大的影响。参数的选择主要有遗传算法、粒子群优化算法、网络遍历法。在确定最优参数时,需要评价参数的优劣,通常

28、使用的方法是k-折交叉确认法。(二)主成分分析法主成分分析(简称PCA)是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。设X1,X2,...,Xp为研究对象所涉及的p个属性,Y1,Y2,...,Ym(m≤n)表示由x1,x2,...,xp线性组合得

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。