基于人工免疫增量的聚类算法.pdf

基于人工免疫增量的聚类算法.pdf

ID:55399359

大小:169.16 KB

页数:2页

时间:2020-05-15

基于人工免疫增量的聚类算法.pdf_第1页
基于人工免疫增量的聚类算法.pdf_第2页
资源描述:

《基于人工免疫增量的聚类算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2010年第12期大众科技No.12。2010(总第136期)DAZHONGKEJ(CumulativelyNo.136)基于人工免疫增量的聚类算法谢静苏一丹(广西大学计算机与电子信息学院,广西南宁530004)【摘要】文章提出了一种基于人工免疫增量的聚类算法。该算法在人工免疫可更新聚类算法的基础上,结合蚁群增量聚类算法的思想,将原聚类得到的记忆抗体矩阵作为初始矩阵,调用人工免疫聚类算法处理增量数据,然后采用类解体机制处理类内误差超过规定阈值的聚类。【关键词】人工免疫;aiNet;记忆抗体;增量聚类【中图分类号】TP301.6【文献标识码】A【文章编号】1008—1151(2010)12—00

2、38-02随着互联网络技术的发展,万维网发展成了一个拥有海引入“年龄”概念来筛除长期不被识别的抗体,但是它没能量资源的消息中心,如何在海量信息中找到自己感兴趣的事解决有增量数据的情况下,聚类簇的更新问题。物,也成为了网页浏览者最为关心的问题,于是,基于该项为此,本文考虑当有新的用户访问网站,从而给数据集应用的推荐系统便应运而生了。为求得到较为准确的推荐结带来新的待分类数据或者当用户的兴趣爱好随着时间、环境果,系统需要深入挖掘用户的浏览信息,并建立相应的数据的变化而变化,从而产生新的增量数据时,聚类簇如何适时档案,以此作为产生推荐的依据。聚类技术作为一种重要的的进行更新处理,以反应当前情况下用户

3、群的访问特点。本Web数据挖掘技术,在挖掘用户的详细信息方面具有很大的优文引入了蚁群增量聚类算法中的类解体机制,构造增量式人势,受到了众多学者的关注,得到了很大的发展。工免疫聚类算法。但是,目前的聚类算法,大多数都不具备随着用户浏览1.算法思想行为的改变而动态调整的能力。金阳等运用有序概念格的思增量式人工免疫的主要思想是:在寻找新增数据对象的想提出了一种增量挖掘方法,但随着数据量的增大以及数据归属类时,首先将原先采用人工免疫聚类算法得出的记忆抗间的关联度、复杂度的增加,该方法的有效性会有所降低。体矩阵作为初始矩阵,将新加入的数据对象看做尚未进行聚董一鸿等基于竞争型神经网络模型,实现了新记忆的透

4、明添类处理的抗原数据,调用人工免疫聚类算法进行聚类。为了加,但由于存储容量的限制,在大规模数据时处理效果较差。防止进行完增量聚类后得到的聚类过于松散或者聚合度较后来,人们通过对生物免疫系统的研究,认识了该系统的免低,需要进行类内误差的检查,即在调用完增量算法后,需疫记忆、分布式并行处理、自组织、自学习、自适应等特点,检查新聚类的类内误差,如果该误差大于规定的阙值,则依构造出了人工免疫系统(AIS)。在此基础上,刘韬等提出了照类解体机制将该类解体,释放出类内的所有抗原数据对象,一种不需制定初始聚类数量的人工免疫系统聚类算法,可快并将相应的记忆抗体从记忆抗体矩阵中删除。而被释放出的速得到聚类的可行

5、解。王堵等将人工免疫系统的重要模型抗原作为待聚类数据,在此时的记忆抗体矩阵下依次调用人aiNet模型与层次聚类算法相结合得到了aiNHA算法,该算法工免疫聚类算法进行聚类,并依此法循环往复下去,直至不的适应性不受形成的聚类簇的形状的限制,而且也具有免疫再有聚类被解体,此时整个增量聚类算法结束。采用该算法算法高速高效的优点。本文在aiNet聚类算法的基础上,针进行的增量聚类,能够及时的表现和反应用户访问兴趣的变对当前增量聚类算法存在的问题,将人工免疫系统的特点与换情况,同时也保证了新生聚类的质量。蚁群增量聚类算法的思想相结合,提出了基于人工免疫的增2.主要公式说明量聚类算法。聚类误差采用偏离方差

6、平均值计算公式:(一)增量式人工免疫聚类算法的基本原理:虽然目前的aiNet算法在实验中都得到了很好的效果,砉丽但是在聚类簇即最终抗体集的更新上没有做深入的研究。范表示记忆抗体矩阵中第j个记忆抗体的第i个分量。志宏等提出了一种基于人工免疫可更新簇聚类算法。该算法【收稿日期】2010—09—29【作者简介】谢静,广西大学计算机与电子信息学院研究生。一38.类解体的阙值判断条件为:D,≤D,·Ⅳ,,/(2)(3)聚类结果.即当前第n次聚类的误差均值的上限条件是:前一次(n一1聚类算法采用VC++6.0编程实现,实验所采用的Pc机配置为:CPUPentium(R)DualE22002.20GHz,内

7、存为2.0GB。次)聚类的类内误差均值的Ⅳ/Ⅳ一l倍,一旦大于该阈值,实验时,先用3000个会话数据进行初始人工免疫聚类,再分5次添加增量数据,每次添加1000条。下面两图所示的那么该聚类解体,否则不解体。N表示第n次聚类时记忆.分别为该增量聚类算法的平均类内误差和算法执行时间。抗体j的对象数目。(二)基于人工免疫增量的聚类算法1.算法描述增量算法可描述如下:输入:已聚类的用户访问特征数据对象及记

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。