基于频繁特征模式挖掘的期货市场单边运行深度的预测.doc

基于频繁特征模式挖掘的期货市场单边运行深度的预测.doc

ID:48455381

大小:29.00 KB

页数:6页

时间:2020-01-31

基于频繁特征模式挖掘的期货市场单边运行深度的预测.doc_第1页
基于频繁特征模式挖掘的期货市场单边运行深度的预测.doc_第2页
基于频繁特征模式挖掘的期货市场单边运行深度的预测.doc_第3页
基于频繁特征模式挖掘的期货市场单边运行深度的预测.doc_第4页
基于频繁特征模式挖掘的期货市场单边运行深度的预测.doc_第5页
资源描述:

《基于频繁特征模式挖掘的期货市场单边运行深度的预测.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、.word格式,基于频繁特征模式挖掘的期货市场单边运行深度的预测  [摘要]金融市场是一个受多种因素影响的、庞大的系统,具有非常复杂的运动规律,金融时间序列中必定蕴含了金融系统诸多的客观规律信息。本文将以商品期货作为基本的研究对象,引入数理统计的思想,将市场按照运行规律进行数据切分,形成单边模式序列与震荡点序列。在此基础上,结合领域知识以及金融时间序列数据的特征,通过改进的频繁特征模式挖掘算法,对单边运行深度的比例进行实时预测。  [关键词]商品期货;数理统计;频繁特征模式挖掘  doi:10.3969/j

2、.issn.1673-0194.2015.17.063  [中图分类号]F746.16[文献标识码]A[文章编号]1673-0194(2015)17-0120-02  1基于市场行为的时间序列切分及表示方法  为了对原始时间序列数据进行维约简,传统的时间序列数据建模通常采用分段表示的方法,整体可划分为2类:基于时域的分段表示方法与基于变换域的分段表示方法。  对于本文的基本研究对象――商品期货,为充分还原其主要的市场特征,即单边运,专业.专注..word格式,行模式及震荡情形,本文引入数理统计中线性回归的思

3、想,基于市场行为,对时间序列进行切分处理。  在对时间序列数据进行切分时,针对每个子序列进行线性回归,当切分得到的子序列的回归判定系数R2大于设定的阈值r时,可将时间序列中的下一个数据点加入该子系列中继续计算,否则,可将当前数据点视为切分断点,从该数据点开始搜寻下一个子序列,直至整个序列搜索完毕或到达最新时间点。对于切分后得到的数据,长度达到3及以上的子序列,即可视为市场单边模式序列,采用线性回归结果进行描述;对于切分断点,相连即得到市场震荡点序列。  以伦敦金属交易所(LME)交易品种之一的伦铜期货为主要

4、研究对象,将2001年1月2日至2015年5月12日的伦铜指数日交易数据的收盘价作为样本,进行数据的切分处理以及后续的规律挖掘,其中回归判定系数阈值r设定为0.7。  具体可获得3632个交易日的交易数据,包括各交易日的开盘价、收盘价、最高价、最低价、成交量、持仓量等信息,如表1。  按照上述算法描述,对3632个交易日收盘价序列进行数据切分,获得单边模式序列及震荡点序列。  如图1所示为2015年3月13日至2015年4月17日40个交易日的收盘价序列的切分结果。,专业.专注..word格式,  对于切分

5、后得到的线段序列,每个线段序列以2个属性进行描述:单边模式/震荡调整持续时间、单边模式/震荡调整趋势幅度。  2关于单边运行深度预测的频繁特征模式挖掘  本节在市场切分后,基于改进的频繁特征模式挖掘过程,对单边运行的深度进行预测。着重研究对切分得到的单边模式序列及震荡点序列的符号化表示,在此基础上基于互关联后继树模型的频繁特征模式挖掘算法,以及通过频繁特征模式匹配实现单边运行深度预测的过程。  传统的时间序列频繁特征模式挖掘基本上可概括为两阶段:序列特征的描述及挖掘算法的设计。即首先利用移动时间窗口对时间序

6、列进行分段,并对各个子段进行聚类,利用形成的符号对序列特征进行描述。在此基础上,利用关联规则挖掘思想及算法,对上述符号化序列进行频繁特征模式发现。本文提出,对切分后得到的线段序列,结合市场实际运行特征,对线段在时间轴上的长度及线段的斜率分别进行符号化,利用得到的二维属性组进行频繁特征模式挖掘。,专业.专注..word格式,  基于上节思想,将2001年1月2日至2015年2月5日的伦铜指数日交易数据作为样本,设定回归判定系数阈值为0.75,进行数据切分,获得了单边模式序列及震荡点序列。对上述1070组切分后

7、形成的线段序列,针对震荡点序列与单边模式序列,按照不同的策略,选取二维属性组(持续时间分类标记、运行深度分类标记),进行符号化表示:  将震荡点序列的持续时间分类标记设为10,运行深度分类标记设为100;  将单边模式序列持续时间分类标记按照超短期、短期、中期、长期分别设为1、2、3、4,运行深度按照是否超过相邻的上一单边模式序列的深度分别设为1、-1。  在对上述样本数据切分后形成的1070组线段序列选取二维属性组(持续时间分类标记、运行深度分类标记),进行符号化表示的基础上,将2001年至2011年涵盖

8、的833组符号化的线段序列作为主要的训练数据,根据基于互关联后继树频繁特征模式挖掘过程,对其建立tSIRST(时间序列互关联后继树)模型,设定最小支持数阈值,并基于tSIRST模型进行频繁特征模式挖掘。表2所示为设定最小支持数为3,最小置信度为70%情况下,挖掘得到的频繁特征模式。  根据频繁特征模式的挖掘结果,设定最小置信度阈值进行筛选,利用筛选后的频繁特征模式,对2012年至2015年市场实时跟踪得到的特征模

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。