欢迎来到天天文库
浏览记录
ID:5350594
大小:174.81 KB
页数:3页
时间:2017-12-08
《1··关联规则挖掘在证券业个性化服务中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、维普资讯http://www.cqvip.com第31卷第19期计算机工程2005年1O月Vo1.31№l9ComputerEngineeringOctober2OO5·开发研究与设计技术·文章缩号t1oo0-—3428(2IH】5)1_一o214__03文献标识码:A中圈分类号:TP311关联规则挖掘在证券业个性化服务中的应用徐晓..I,黄林囊,顾鲁康(1.上海交通大学计算机科学与工程系,上海200030;2.东吴证券有限责任公司,苏州215007)摘要:提出了一种适用于证券业交易数据库挖掘的频繁模式链表关
2、联规则挖掘算法,它采用共享前缀交易项树和频繁模式链表结构,无须产生候选项集,FPL—growth算法通过直接排列出链路中的频项组合,就可得到完整的频繁模式集,且支持多阈值挖掘,挖掘到的关联规则带有时间段属性,特别适用于证券业的个性化信息需求获取。关健词:关联规则;共享前缀交易树;频繁模式链表;频繁模式链表关联规则算法;时间属性;证券ApplicationofAssociationRuleMiningi‘nPrersoOnalServiceolS~tocki
3、obberXUXiaofeng,HUANGLinpe
4、ng,GUXikang(1.Dept.ofComputerScienceandEngineering,ShanghaiJiaotongUniversity,Shanghai200030;2.DongwuStockCo.Ltd.,Suzhou215007)[Abstract]Thispaperproposesanassociationrulealgorithmwhichisthesamewithtradedatabaseofstock.Itusesshareprefixtransactiontreeandfre
5、quentpatternlink(FP—link)datastructure,andallowsfrequentpatternminingwithoutgenerationofcandidateitemsets.FPL—growthalgorithmgainsfrequentpatternsetsviastraightarrangecombinationoffrequentitemsetswithinlink.Itcanbeusedformultiplefrequentpatternminingwithdif
6、erentsupportsandobtainedassociationrulehaspropertyoftime,especiallyappliesinstockjobbertOgainpersonalinformationrequirement.[KeywordsiAssociationrule;STP-·tree;FP-·link;FPL-·growth;Time-·property;Stock1问题的提出孩子。关联规则挖掘即在数据中查找存在于项目集合之间的频(2)一个交易项头表。繁模式、关联、相关性或因
7、果结构。大部分关联规则挖掘采(3)节点包含4个域:交易项名item—name:节点代表的交易项;计数值count:通过某条路径到达这节点的交易次数;链接指针用的是Aprior⋯类方法。但产生候选集的代价是非常高的。node-link:指向下一个同名的节点,如无则标记为“null”;父指针FP-tree[21和CATS—tree[31算法提出了压缩存储和不产生候选项parent-link:指向前缀路径中的父节点。集的思想,但前者不支持多阈值挖掘,后者对树遍例扫描代(4)头表条目包含3个域:交易项名item—na
8、me:交易项名字;价比较高,且都不适用于证券业,因它们都要求交易为多交计数值count:交易项在DB中出现的次数;链接指针node.1ink:指易项(一笔交易中常有多种商品),且得到的频繁模式不包含向SPT-tree中同名的左边第1个节点。时间属性(即购买啤酒的人80%会同时购买尿布,而不是在(5)频项列表中每个项在头表中各占一个条目。未来某个时段内会购买)。而证券业数据库有其特殊性,表现根据定义1有如下SPT-tree构造算法:为每笔交易均为单交易项的,且多数客户交易是有间隔的。算法l带有交易项合并(固定时
9、段属性)的构建SPT-tree为此,本文提出了FPL—growth算法,它适用于多交易项算法也适用于证券业单交易项数据库挖掘,只需扫描两遍数据库,输入:数据库(单交易项数据库),合并时间参数T(无能得到带有时间段属性的频繁交易模式,且它还支持多阈值须输入支持度阈值)。挖掘,用以满足证券业个性化服务对预知投资者信息需求的输出:它的SPT-tree。目的。成为了FPL—growth区别与其它方法的不同之
此文档下载收益归作者所有