一种基于粒子群优化的关联规则挖掘方法.pdf

一种基于粒子群优化的关联规则挖掘方法.pdf

ID:56219280

大小:331.87 KB

页数:5页

时间:2020-06-21

一种基于粒子群优化的关联规则挖掘方法.pdf_第1页
一种基于粒子群优化的关联规则挖掘方法.pdf_第2页
一种基于粒子群优化的关联规则挖掘方法.pdf_第3页
一种基于粒子群优化的关联规则挖掘方法.pdf_第4页
一种基于粒子群优化的关联规则挖掘方法.pdf_第5页
资源描述:

《一种基于粒子群优化的关联规则挖掘方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、v01.3lNo.3安徽工业大学学报(自然科学版)第31卷第3期July2014J.ofAnhuiUniversityofTechnology(NaturalScience)2014年7月文章编号:1671—7872(2014)03—0318—05一种基于粒子群优化的关联规则挖掘方法潘唯,刘彦鹏,汤亚玲(安徽工业大学计算机科学与技术学院,安徽马鞍山243032)摘要:针对关联规则挖掘过程中定义最小支持度与置信度的阈值具有主观性的问题,提出一种迭代粒子群优化(particleSWSIT~Ioptimization,PSO)的方法挖掘关联规则。通过定义要提取的规则数目C的值,采用支持度和置信度定

2、义适应函数,粒子群优化算法迭代。从数据集中提取最优的规则。算法避免了apdod算法需要设定最小支持度和最小置信度阈值等问题。通过对3个不同类型典型数据集挖掘验证算法的有效性,结果表明,使用PSO获得的规则平均支持度和置信度与apnofi算法挖掘到的规则相比有明显提高。关键词:关联规则挖掘;粒子群优化算法;支持度;置信度;最优规则中图分类号:TP181文献标志码:Adoi:10.3969~.issn.1671—7872.2014.03.021ANovelAlgorithmBasedonParticleSwarmOptimizationtoAssociationRuleMiningPANWei,

3、LIUYanpeng,TANGYaHng(SchoolofComputerScienceandTechnology,AnhuiUniversityofTechnology,Ma‘anshan243032,China)Abstract:Inordertoavoidtheproblemthatthethresholdvalueoftheminimumsupportandminimumconfidenceissubjectivelyintheassociationruleminingprocess,amethodbymeansofusingparticleswarmoptimizationispr

4、oposed.BydefiningthevalueofMwhichisthenumberoftherulesandusingsupportandconfidencetodefmethefitnessfunction,thealgorithmiterationsgeneratethebestrulesfromthedata.Thealgorithmavoidssettingthethresholdvalueofminimumsupportandminimumconfidenceandotherproblemsinapriori.Theefectivenessoft.healgorithmiSt

5、estedonthreediferenttypesoftypicaldatasets,andtheresultsshowthattheaveragesupportandconfidenceoftherulesobtainedbyPSOishigherthanwhatisobtainedbyapriori.Keywords:associationrulemining;particleswarmoptimization;support;confidence;bestrules关联规则挖掘是在大量数据之中发现有趣的规则Ⅲ。随着海量数据的不断收集和存储,许多行业开始对从数据库中挖掘关联规则越来越有兴

6、趣。针对经典关联规则挖掘算法一apriori算法t2具有多次扫描数据库和产生大量频繁候选集的问题,许多研究者对其进行改进,出现了多种apriori算法的改进算法p。随着进化算法和集群算法的提出和发展,人们将目光转向使用这些算法来获取理想的规则。文献[5】提出了一种基于粒子群算法分类关联规则的提取算法,然后使用提取的分类关联规则预测雷雨天气,取得了很好的效果;文献【6】使用加权粒子群优化算法,过滤掉冗余的规则,从而减少空间的问题;文献【7】采用共同进化算法,利用改进遗传算法和粒子群优化算法的优势,发现高品质的关联规则。文献【8】使用二进制粒子群优化算法为apriori算法寻找阈值。这些研究中,

7、PSO用来获取最小支持度和最小置信度,或优化提取到的关联规则,在一定程度上提高了挖掘关联规则的质量,但仍需要人工设置阈值,不能完全避免阈值带来的影响:阈值偏高会忽略一些有价值规则,阈值偏低导致挖掘到很多无用规则。本文提出一种使用PSO提取数据库的最优关收稿日期:2013—12—02基金项目:安徽省高校重点项目(JK20l0A-051,KJ2011A039);安徽工业大学研究生创新研究基金(20l3085)作者

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。