数据挖掘中的进化计算综述

数据挖掘中的进化计算综述

ID:44510019

大小:364.66 KB

页数:23页

时间:2019-10-22

数据挖掘中的进化计算综述_第1页
数据挖掘中的进化计算综述_第2页
数据挖掘中的进化计算综述_第3页
数据挖掘中的进化计算综述_第4页
数据挖掘中的进化计算综述_第5页
资源描述:

《数据挖掘中的进化计算综述》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数据挖掘中的进化计算综述?李晅松(南京大学计算机科学与技术系,南京210093)ASurveyofEvolutionarycomputationindatamining*LiXuansong(DepartmentofComputerScienceandTechnology,NanjingUniversity,Nanjing210093,China)Abstract:Evolutionarycomputation(EC)isanoptimizationprocesssimulatingnaturalevolution.It

2、isaresearchhotspotonsomedomainsofcomputerscieneesuchasAl.ThispaperintroducesthefundamentaltheoryofEC.Andthen,itdiscussesthreeaspectsofgeneticalgorithmsforrulediscovery:individualrepresentation,geneticoperatorandthedesignoffitnessfunctions.Thepaperalsotakesneuraln

3、etworksasanexampletoshowtheresearchofcombiningevolutionarycomputationwithothermethods.Lastly,itshowsthepossiblefutureresearchdirectioninthisarea.Keywords:Evolutionarycomputation;geneticalgorithm;datamining;rulediscovery;artificialneuralnetworks摘要:进化计算是一种模拟生物进化的优化

4、过程,它是计算机科学中人工智能等领域研究的热点。本文介绍了进化计算的基本理论;从个体表示、遗传操作、适应度函数设计三个方面描述了用遗传算法进行规则发现的过程;以神经网络为例介绍了对于进化计算与其他方法结合的研究。并分析了相关研究的发展方向关键词:进化计算;遗传算法;数据挖掘;规则发现;神经网络中图法分类号:TP18文献标识码:A1引言随着人类生产和搜集数据的能力大幅度提高,迫切需要找到从数据库和网络的大量数据中提取知识的手段。然而,人类分析数据能力的进步进度远远落后与搜集存储数据的技术进步[1]0为了解决这个问题,研究者

5、引入了数据挖掘的概念和技术。数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取可信、新颖、有效并能被人理解的信息和知识的高级处理过程[2]。进化计算是一种使用进化过程的计算模型作为设计和执行的关键步骤的问题解决体系[3],它包括遗传算法[4]、进化规划[5]、进化策略[6]、遗传编程[7]等。尽管进化计算有很多变化,它们都是基于达尔文等生物学家在生物进化领域研究的成果建立起的计算模型。与传统的基于微积分的方法和穷举法等优化算法相比,进化计算是一种成熟的具有高鲁棒性和广泛适用性的全

6、局优化方法。具有自组织、自适应、自学习的特性[8]。本文主要探讨进化计算的方法用在数据挖掘中进行分类预测的规则发现。需要指出的是,进化计算的方法在数据挖掘中的应用不仅限于此,它可用于评估其他算法的拟合度[2],还可以用于KDD中预处理、后作者简介:李晅松,南京大学计算机科学与技术系研究生加工阶閔,限于篇幅,本文不对这些内容做过多锐本文组织如下:第二节对进化计算的基本理论和方法进行描述,重点介绍遗传算法,第三节描述在数第丑给据挖掘的规则发现任务中使用进化算法的过程,第四节介绍进化算法与释辭等方法的结合,出总结和展望2进化计

7、算基本理论和方法自然界的进化是一个基于种群的最优化过程。在处理复杂的现实问题时,用计算机中的随机卓棋这个过程往往可以得到比传统方法好的效果。目前,进化计算的研究主要分三个方面遗传算法、进化规划和进化策陶。本节详细介绍遗传算法的操作过程,并简要介绍进化规划、进化策略通过比軸述进化算法的要点。2.1遗传算法Fraser[9]-[13]>Bremermann等人[14]-[21]>Reed等人[22]和Holland[4],[23]分别提出过相似的阚专过程的算法,现在这些算法被称为遗传算法(geneticsystems)。遗传

8、算法一般按照以下骡拣[8]:1)对于待处理的问题确定一个表示某组可能解适应度的目标函数。2)将候选解的种群初始化为服从特定的缩一般情况下,将每组试验解飾为酸x,称为染色体,其中的元素称为基因,特定位置的不同值称为等位基因。Holland[4,pp.70・72]提出将所有解表示为二进制串。例如,要确定标量的值,使得2F

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。