基于免疫记忆克隆的关联规则挖掘.pdf

基于免疫记忆克隆的关联规则挖掘.pdf

ID:55399353

大小:249.51 KB

页数:4页

时间:2020-05-15

基于免疫记忆克隆的关联规则挖掘.pdf_第1页
基于免疫记忆克隆的关联规则挖掘.pdf_第2页
基于免疫记忆克隆的关联规则挖掘.pdf_第3页
基于免疫记忆克隆的关联规则挖掘.pdf_第4页
资源描述:

《基于免疫记忆克隆的关联规则挖掘.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第12卷第35期2012年12月科学技术与工程Vo1.12No.35Dec.20121671—1815(2012)35—9537—04ScienceTechnologyandEngineering⑨2012Sci.Tech.Engrg.基于免疫记忆克隆的关联规则挖掘汪宏海(赣南教育学院计算机系,赣州341000)摘要针对数据关联规则挖掘的不足,提出了一种基于免疫记忆克隆算法的关联规则挖掘方法。算法利用了免疫记忆特性,把挖掘的关联规则存入记忆库,加快了挖掘速度。在克隆扩增过程中,设计了一种基于矢量距的抗体浓度计算方法,保证克隆扩增过程中解的多样性。仿真实验结果表明,现算法具有较快的运行速度,

2、提高了所得关联规则的准确性。关键词免疫记忆克隆关联规则数据挖掘抗体浓度中图法分类号TP301.6;文献标志码A关联规则挖掘是数据挖掘领域中的一个重要可以提取用户感兴趣的关联规则,提高了所得关联研究方向,具有广泛的应用价值¨j。从本质上看,规则的准确率,并且速度较快。关联规则挖掘主要目的是挖掘数据项集之间的某1算法基础和关键技术种潜在的关系,从而在大量数据中发现潜在和有价值的关联关系,为决策者提供适当的依据。目前,1.1关联规则挖掘的基本概念广泛使用的关联规则挖掘算法是Apriori算法及其关联规则挖掘致力于数据库中指标项之间关改进算法J。这些算法在关联规则挖掘中取得了联规则或相关关系的挖掘

3、,实际上真正体现了数据很好的效果,能够比较准确地挖掘出用户需要的关中的知识发现。设,=(,i:,⋯,i)是数据项的集联规则,但是其挖掘效率比较低,难以适用大规模合,D为项组合的一个集合。关联规则是形如A一数据集。因此,有必要提出更好的算法来解决关联的蕴涵式,其中A∈,,B∈,,并且nB=。一规则挖掘算法的效率问题。从本质上看,关联挖掘般用支持度和置信度描述关联规则的属性。其中,算法的核心思想是找到频集,实际上就是在一定的支持度S(support)定义为(A):生,事务空间内进行搜索,将有关联关系的元素搜索出来,n集D中同时包含事务A和B的百分比,称为规则是一个全局搜索的优化过程。同时,已有

4、的研究表明,智能优化算法用于关联规则挖掘是可行的。文AB具有支持度.s。置信度G(confidence)定义为献[5,6]分别采用遗传、基本免疫算法等进行实现,(AB)=。事务集D中包含A的事务数n./1取得了一定的求解效果,但效果还有待进一步优与同时包含B的事务数的百分比,称为规则AB具有化。常见的关联规则挖掘都是一种“由底向上”,置信度c。显然,只有支持度较大的规则才是较有价“由小到大”的逐层搜索、逐步优化的过程,这个过值的规则,只有置信度比较高的规则才是比较可靠程中需要强有力的搜索策略的支持。现提出了基的规则。因此,只有支持度与置信度均较大的规则于免疫记忆克隆的关联规则挖掘算法,在搜

5、索过程才是比较有价值的规则。中很好地保持了种群多样性。实验结果表明,算法在关联规则挖掘时,往往需要事先指定最小支持度与最小置信度。如果一个规则满足最小支持2012年8月13日收到作者简介:汪宏海(1977一),男,硕士,研究方向:仿生学算法,数据度,则称这个规则是一个频繁规则;如果一个规则挖掘。同时满足最小支持度与最小置信度,则通常称这个规则是一个强规则。关联规则挖掘的通常方法是:科学技术与工程l2卷首先挖掘出具有最小支持度的频繁项集,再从得到M(k):{M(k),(k),⋯,(k)};设置保留种的频繁规则中挖掘强关联规则。群R(k),规模为t=n—s,则R(k):}R(k),1.2算法对

6、应关系(k),⋯,月(k)},所以有人工免疫系统是一种受启发于生物免疫系统A(k)=M()UR()。功能的智能优化算法。免疫克隆选择是人工免疫步骤2亲和度评价系统的主要优化算法之一,已经在不同的领域得到分别计算抗体种群亲和度,并按亲和度大小降了广泛应用。免疫克隆算法通过克隆、选择、变异序对抗体进行排列,选出前s个抗体更新记忆种群等算子对算法逐步进行优化l-j。该算法采用免疫(k)。记忆克隆算法产生频繁规则,然后计算这些规则的步骤3终止条件判断,各种组合是否满足最小可信度,从而产生强关联规如果达到最大迭代次数k⋯,算法终止,将记忆则。使用免疫克隆算法进行关联规则挖掘时,将数种群中保存的亲和度

7、最高的抗体进行映射,即得到据库中的所有记录作为抗原,候选模式作为抗体。了最佳的结果;否则,转步骤4。最后,关联规则由记忆细胞所代表的频繁模式生成。步骤4克隆扩增1.2.1编码方式对这s个抗体进行克隆操作,形成种群编码方式是免疫算法进行求解的关键步骤。Y(k)。对克隆操作定义为免疫算法中,每一个抗体表示一种可能的解。由于r(k)=(M())={[M(k)],[M(k)],⋯,用于关联规则挖掘的主要是事务型数据库,因此,[(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。