关联规则挖掘算法在股票预测中的应用研究——基于遗传网络规划的方法

关联规则挖掘算法在股票预测中的应用研究——基于遗传网络规划的方法

ID:46278872

大小:1.13 MB

页数:4页

时间:2019-11-22

关联规则挖掘算法在股票预测中的应用研究——基于遗传网络规划的方法_第1页
关联规则挖掘算法在股票预测中的应用研究——基于遗传网络规划的方法_第2页
关联规则挖掘算法在股票预测中的应用研究——基于遗传网络规划的方法_第3页
关联规则挖掘算法在股票预测中的应用研究——基于遗传网络规划的方法_第4页
资源描述:

《关联规则挖掘算法在股票预测中的应用研究——基于遗传网络规划的方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、关联规则挖掘算法在股票预测中的应用研究——基于遗传网络规划的方法口陈艳褚光磊(上海财经大学统计与管理学院,上海200433)[摘要]将遗传网络规划用于解决数据挖掘中的关联规则问题。相对于传统的关联规则挖掘算法,基于遗传网络规划的方法通过其中的遗传算子能够以递增的方式发现关联规则,从而避免了传统方法需要将全部数据库遍历才能得到规则的局限性。通过将要挖掘的关联规则定义为事务问的关联规则,以解决股票市场中的价格预测问题。[关键词]遗传网络规划;数据挖掘;遗传算法;关联规则;股票预测【中图分类号]F船0.91【文献标识码]A【文章编

2、号]1003—1154(2014)03-0013-03关联规则是数据挖掘领域中一个重要的研究方向。关联规则问题最初是由Agrawal⋯提出的,研究隐藏于大型数据库中的数据项之间的关系。事务间关联规则可以看作是普通关联规则的一个拓展,它将原来基于单交易的关联规则推广到了多条交易中,这种跨事务间的特性使得关联规则算法可以广泛应用于预测问题中。本文基于遗传网络规划的方法挖掘事务间的关联规则,并将得到的规则应用于股票市场的价格趋势预测中。在关联规则的研究中,核心的问题是关于挖掘算法的设计,其中常用的方法是Agrawal提出的Apri

3、—ori算法。在大型数据库的条件下,学者们提出了基于进化计算的关联规则的挖掘算法。FreitasL21在其著作中介绍了运用进化算法的思想进行关联规则挖掘的方法。我国学者针对应用遗传算法挖掘关联规则的问题,也提出了相应的方法。如武兆慧等、31利用模拟退火遗传算法进行关联规则的挖掘;许国艳和史宇清。4】则利用遗传算法解决关联规则的挖掘问题。一、基于遗传网络规划(GNP)的事务间关联规则挖掘算法(一)遗传网络规划模型结构遗传网络规划是基于遗传算法与遗传规划提出的一种新型进化算法。遗传算法的基本原理,是将优化问题的一个可行解作为种群

4、的一个个体。通常采用一定的编码方法对解集进行编码。采用随机的方法得到一定数量的个体组成一个种群。设定一个合适的适应度函数对每个个体进行评价。然后通过遗传算子(选择、交叉、变异)得到更好的种群,也就是相应优化问题的更优解。遗传网络规划(GeneticNetworkProgramming)保留了遗传算法的迭代进化的思想,同时用网络图形的结构描述所要研究的问题,将遗传算法所适合研究的优化问题进行扩展,以便能够用于解决更复杂的优化问题。(二)基于遗传网络规划的事务间类关联规则挖掘1.事务间类关联规则的定义将传统的关联规则推广到事务间

5、类关联规则,是将其数据项进行扩展,相同的数据项在不同的交易中,可作为不同的数据项来处理。设,={i¨,i。⋯⋯,i⋯⋯⋯,i⋯i彬⋯⋯,i。。}为有/txm项组成的项集,每一个i。,=(扛l,2,⋯⋯,凡.,=1,2,⋯⋯,m)表示交易i中的数据硼,因此当p=q时,ij=i酽事务间类关联规则的定义可以表示为:R:X—y,其中X∈,,y∈C。2.基于GNP的事务间类关联规则挖掘算法利用GNPX寸事务间类关联规则进行挖掘,需要对GNP的模型结构进行一系列的设定。具体方法为:定义一个称为判断节点链的结构,即将判断节点按顺序连接起来

6、,如图1所示。一个判断节点链表示一个事务,每一个判断节点用于容纳一个数据项,并作为关联规则前项中的一个数据项。判断节点中包含If.[基金项目]国家自然科学基金资助项目(71101083);上海财经大学博士研究生创新基.金(cx33—2012—421)2014年第3期_囵Then类型的判断结构,当满足条件时,下一个判断节点被选中;如果没有满足条件,则指向执行节点,进而再指向下一个判断节点,它决定了下一个判断节点链中被选中的判断节点。在确定了判断节点链之后,可将埘个节点链组合起来成为一个节点链集,如图1所示。其中W即是滑动窗口的

7、窗宽,这里用窗口的概念将事务内关联规则拓展到事务问关联规则的问题。如表1所示,给定的窗口宽度为4,即用前3天的数据预测下一天分类c的取值。利用该结构,可以对事务间的类关联规则进行挖掘。图1判断节点链集结构表1一个窗口中的规则寻找方法nl●12▲丑嵫m“l●●2C:1霄)雨‘V和’●^-ll2’一丫11。,上、2互l1l■o)I^●f0)‘●(1)I(ty了O3¥v=k纠.:‘5OlO在表1中,模拟了一次规则寻找的过程。沿箭头所指的方向,可以开始数据项集的遍历过程。如果当前判断节点的值为l,那么就将当前判断节点进行标记。并前进

8、到节点链中下一个节点再次进行判断。如果当前判断节点的值为0,则条件不满足,此时执行节点会被选中,再由执行节点决定下一个判断节点的指向。在一个数据窗口中,按照以上原则对所有GNP个体中的规则进行挖掘并标记,如表l所示,在一个窗口挖掘结束后,通过窗口的滑动,可继续进行规则的寻找,直到数据集的最

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。