资源描述:
《基于基因表达式编程的股票指数时间序列分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2005年10月四川大学学报(自然科学版)Oct.2005第42卷第5期JournalofSichuanUniversity(NaturalScienceEdition)Vol.42No.5文章编号:049026756(2005)0520931206基于基因表达式编程的股票指数时间序列分析111,211廖 勇,唐常杰,元昌安,陈安龙,段 磊(1.四川大学计算机学院,成都610064;2.广西师范学院信息技术系,南宁530001)摘要:基因表达式编程(GEP)是遗传算法研究的新分支.针对股票对象的特点,提出了适应股票规律的GEP2STOCK模型
2、,包括n时段2STOCK2GENE,STOCK2fitness以及STOCK2GEP算法,并以上海证券交易指数时间序列数据为对象做了实验.进行了误差和指数涨跌分析.实验结果表明GEP2STOCK模型预测精度较高,20d的平均绝对误差为11.08,平均相对误差为0.64%.从涨跌情况预测来看,模型对6d后指数的涨跌判断,正确率高于80%以上.关键词:数据挖掘;基因表达式编程;时间序列;股票数据中图分类号:TP311 文献标识码:A1 引言 数据预测在金融投资领域占有重要地位,而股票价格是金融数据中最复杂的数据类型之一.经济学家一直致力于研
3、究股票市场价格的变化,希望能从中找出一些规律,避免诸如大的股市波动,从而保持经济繁荣稳定.股票市场是一个复杂的非线性动力系统,同时受多种因素的交互影响,对于股票未来价格的精确预测是非常困难的.股市预测被认为是当前时间序列预测中最富挑战性的应用之一,受到数据挖掘[1]界的广泛关注.股票价格涨跌数据是一种时间序列数据,它既具有一定的趋势性又具有较大随机性.自19世纪股票市场建立以来,股票价格预测模型就成为各国学者研究的焦点.在时间序列预测中,线形的概率统计模型曾得到广泛的应用,如:ARMA模型法、AR模型法、阈值自回归、多项式自回归、指数自回归模
4、型等,后来还有灰色预测、混沌时间序列预测等方法.近年来,神经网络方法成为最热点的研究之一,但随着人工神经网络研究的深入,人们认识到它存在的严重不足,在原理上缺乏实质性的突破,同时也缺[2,3]乏理论依据.基因表达式编程GEP(GeneExpressionProgramming)是遗传计算家族的新成员,具有极强的函数发[4]现能力和很高的效率.文[5~8]中,对GEP算法在效率上进行了改进,并应用改进的算法对太阳黑子数据进行时间序列分析,通过把预测结果与传统的5种时间序列分析方法(TAR,叠合(带趋势、不带趋势),ARMA,AR)进行比较,可以
5、看出GEP预测结果的平均绝对误差和最大绝对误差均为最小.我们针对股票对象的特点,提出了适应股票规律的GEP2STOCK模型,包括n时段2STOCK2GENE,STOCK2fitness以及STOCK2GEP算法,并以上证指数时间序列数据为对象做了实验.应用STOCK2GEP算法对2003年的上证指数进行了时间序列分析,挖掘出历史数据为13d的时间序列模型,利用该模型对2004年4月份的上证指数进行预测,取得了较高的精度.另外,利用该模型对指数的升降情况进行预测,对6d后升降情况的判断准确率达80%以上.2GEP简介2.1GEP的基本概念收稿日
6、期:2004212230基金项目:国家自然科学基金(60473071),973计划项目(2002CB111504),博士点基金(20020610007)作者简介:廖勇(1968-),男,2002级硕士研究生©1995-2005TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.932四川大学学报(自然科学版) 第42卷 基因表达式编程(GeneExpressionProgramming,GEP)是CandidaFerreira在遗传算法(GeneticAlgo2
7、rithm,GA)和遗传编程(GeneticProgramming,GP)的基础上发展的新概念,首批研究成果于2000年12月[3]在网上发表,在2001年12月正式发表.虽然GEP与GA和GP相比在主要步骤上都极为相似,但GEP克服了GA与GP的不足,更适合于函数关系的挖掘.它们最本质的区别在于:在GA中个体由固定长度的线性串(染色体)来表示;在GP中个体则是由不同大小和形状的非线性实体(解析树)所表示的;而GEP将个体先编码为固定长度的线性串再表示成大小、形状都不同的非线性实体.这样,GEP就克服了GA损失功能复杂性的可能性和GP难以再产
8、生新的变化的可能性.所以说GEP是GA和GP的继承和发展,它综合了GA和GP的优点,具有更强的解决问[4]题的能力.[4]个体在GEP中又称为染色体,染色体是由基因