欢迎来到天天文库
浏览记录
ID:5289537
大小:179.38 KB
页数:3页
时间:2017-12-07
《关联规则挖掘在证券业中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、维普资讯http://www.cqvip.com第30卷增刊计算机工程2004年l2月VoL30SupplementaryIssueComputerEngineeringDecember2004·基金项目论文·文章编号:1000-3428(2004)~1—彻06—02文献标识码:A中国分类号:TP31I关联规则挖掘在证券业中的应用徐晓峰,黄林鹏‘,展锡(1.上海交通大学计算机科学与工程系,上海200030;2.东吴证券有限责任公司,苏州2l5007)摘要:基于证券业急需一种能帮助其提高个性化服务质量的系统,该文提出了一种适用于证券业单交易项交易数据库挖掘的频繁模式链表关联规则挖掘算法
2、,它采用共享前缀交易项树和频繁模式链表结构,无须产生候选项集,FPL—growth算法通过直接排列出链路中的频项组合,就可得到完整的频繁模式集,且支持多阈值挖掘,挖掘到的关联规则带有时间段属性,特别适用于证券业的个性化信息需求获取。关t词:关联规则;共享前缀交易树;频繁模式链表;频繁模式链表关联规则算法;时间属性;证券Application0fAssociationRuleMininginPersonalService0fStockiobberXUXiaofeng。,HUANGLinpeng。,GUXikang2(1Dept.ofComputerScienceandEngineeri
3、ng,ShanghaiJiaotongUniversity,Shanghai200030;2.SoochowSecuritiesCo.,Ltd,Suzhou2l5007)[Abstract]Thispaperproposesanassociationrulealgorithmwhichisthesamewithdatabaseofsingle—item.Itusesshareprefixtransactiontreeandfrequentpaternlink(FP—link)datastructure,andallowsfrequentpatternminingwithoutgene
4、rationofcandidateitemsets.FPL·growthalgorithmgainsfrequentpatternsetsviastraightarrangecombinationoffrequentitemsetswithinlink.Itcanbeusedformultiplefrequentpatternminingwithdiferentsupportsandobtainsassociationrulehavingpropertyoftime,especiallyappleidinstockjobbytogainpersonalintbnnationrequi
5、rement.IKeywordslAssociationrule;STP—tree;FP—link;FPL-growth;Time—property;Stockl问题的提出易项;计数值count:通过某条路径到达该节点的交易次关联规则挖掘即在数据中查找存在于项目集合之间的频数;链接指针node-link:指向下一个同名节点,如无则标记繁模式、关联、相关性或因果结构。大部分关联规则挖掘采为“null”;父指针parent—link:指向前缀路径中的父节点。用舶是Aprio~类方法。但产生候选集代价极高。FP—tred!‘和(4)头表条目包含3个域:交易项名item—name:交易项CA
6、TS—treet算法提出了压缩存储和不产生候选项集的思想,名字;计数值count:交易项在DB中出现的次数;链接指针但前者不支持多阈值挖掘,后者对树遍历扫描代价比较高,node-link:指向SPT-tre中同名的左边第一个节点。且都不适用于证券业,因它们都要求交易为多交易项(一笔(5)频项列表中每个项在头表中各占一个条目。交易中常有多种商品),且得到的频繁模式不包含时间属性根据定义l有如下SPT—tre构造算法。(即购买啤酒的人80%会同时购买尿布,而不是在未来某个算法1带有交易项合并(固定时段属性)的构建SPT—tre时段内会购买)。而证券业数据库有其特殊性,表现为每笔输入:数据
7、库(单交易项数据库),合并时间参数T(无交易均为单交易项的,且多数客户交易是有间隔的。须输入支持度阈值)为此,文中提出了FPL—growth算法,它适用于多交易项输出:它的SPT—tree也适用于证券业单交易项数据库挖掘,只须扫描两遍数据方法:库,能得到带有时间段属性的频繁交易模式,它还支持多阈值(1)sortDBonCustomer+TimetoDBJ挖掘,用以满足证券业个性化服务对预知投资者信息需求的(2)据T得时段T.(I-l,2⋯)//时段决定规则
此文档下载收益归作者所有