欢迎来到天天文库
浏览记录
ID:48455381
大小:29.00 KB
页数:6页
时间:2020-01-31
《基于频繁特征模式挖掘的期货市场单边运行深度的预测.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、.word格式,基于频繁特征模式挖掘的期货市场单边运行深度的预测 [摘要]金融市场是一个受多种因素影响的、庞大的系统,具有非常复杂的运动规律,金融时间序列中必定蕴含了金融系统诸多的客观规律信息。本文将以商品期货作为基本的研究对象,引入数理统计的思想,将市场按照运行规律进行数据切分,形成单边模式序列与震荡点序列。在此基础上,结合领域知识以及金融时间序列数据的特征,通过改进的频繁特征模式挖掘算法,对单边运行深度的比例进行实时预测。 [关键词]商品期货;数理统计;频繁特征模式挖掘 doi:10.3969/j
2、.issn.1673-0194.2015.17.063 [中图分类号]F746.16[文献标识码]A[文章编号]1673-0194(2015)17-0120-02 1基于市场行为的时间序列切分及表示方法 为了对原始时间序列数据进行维约简,传统的时间序列数据建模通常采用分段表示的方法,整体可划分为2类:基于时域的分段表示方法与基于变换域的分段表示方法。 对于本文的基本研究对象――商品期货,为充分还原其主要的市场特征,即单边运,专业.专注..word格式,行模式及震荡情形,本文引入数理统计中线性回归的思
3、想,基于市场行为,对时间序列进行切分处理。 在对时间序列数据进行切分时,针对每个子序列进行线性回归,当切分得到的子序列的回归判定系数R2大于设定的阈值r时,可将时间序列中的下一个数据点加入该子系列中继续计算,否则,可将当前数据点视为切分断点,从该数据点开始搜寻下一个子序列,直至整个序列搜索完毕或到达最新时间点。对于切分后得到的数据,长度达到3及以上的子序列,即可视为市场单边模式序列,采用线性回归结果进行描述;对于切分断点,相连即得到市场震荡点序列。 以伦敦金属交易所(LME)交易品种之一的伦铜期货为主要
4、研究对象,将2001年1月2日至2015年5月12日的伦铜指数日交易数据的收盘价作为样本,进行数据的切分处理以及后续的规律挖掘,其中回归判定系数阈值r设定为0.7。 具体可获得3632个交易日的交易数据,包括各交易日的开盘价、收盘价、最高价、最低价、成交量、持仓量等信息,如表1。 按照上述算法描述,对3632个交易日收盘价序列进行数据切分,获得单边模式序列及震荡点序列。 如图1所示为2015年3月13日至2015年4月17日40个交易日的收盘价序列的切分结果。,专业.专注..word格式, 对于切分
5、后得到的线段序列,每个线段序列以2个属性进行描述:单边模式/震荡调整持续时间、单边模式/震荡调整趋势幅度。 2关于单边运行深度预测的频繁特征模式挖掘 本节在市场切分后,基于改进的频繁特征模式挖掘过程,对单边运行的深度进行预测。着重研究对切分得到的单边模式序列及震荡点序列的符号化表示,在此基础上基于互关联后继树模型的频繁特征模式挖掘算法,以及通过频繁特征模式匹配实现单边运行深度预测的过程。 传统的时间序列频繁特征模式挖掘基本上可概括为两阶段:序列特征的描述及挖掘算法的设计。即首先利用移动时间窗口对时间序
6、列进行分段,并对各个子段进行聚类,利用形成的符号对序列特征进行描述。在此基础上,利用关联规则挖掘思想及算法,对上述符号化序列进行频繁特征模式发现。本文提出,对切分后得到的线段序列,结合市场实际运行特征,对线段在时间轴上的长度及线段的斜率分别进行符号化,利用得到的二维属性组进行频繁特征模式挖掘。,专业.专注..word格式, 基于上节思想,将2001年1月2日至2015年2月5日的伦铜指数日交易数据作为样本,设定回归判定系数阈值为0.75,进行数据切分,获得了单边模式序列及震荡点序列。对上述1070组切分后
7、形成的线段序列,针对震荡点序列与单边模式序列,按照不同的策略,选取二维属性组(持续时间分类标记、运行深度分类标记),进行符号化表示: 将震荡点序列的持续时间分类标记设为10,运行深度分类标记设为100; 将单边模式序列持续时间分类标记按照超短期、短期、中期、长期分别设为1、2、3、4,运行深度按照是否超过相邻的上一单边模式序列的深度分别设为1、-1。 在对上述样本数据切分后形成的1070组线段序列选取二维属性组(持续时间分类标记、运行深度分类标记),进行符号化表示的基础上,将2001年至2011年涵盖
8、的833组符号化的线段序列作为主要的训练数据,根据基于互关联后继树频繁特征模式挖掘过程,对其建立tSIRST(时间序列互关联后继树)模型,设定最小支持数阈值,并基于tSIRST模型进行频繁特征模式挖掘。表2所示为设定最小支持数为3,最小置信度为70%情况下,挖掘得到的频繁特征模式。 根据频繁特征模式的挖掘结果,设定最小置信度阈值进行筛选,利用筛选后的频繁特征模式,对2012年至2015年市场实时跟踪得到的特征模
此文档下载收益归作者所有