遗传算法在数据挖掘中的应用

遗传算法在数据挖掘中的应用

ID:27715793

大小:250.50 KB

页数:4页

时间:2018-12-05

遗传算法在数据挖掘中的应用_第1页
遗传算法在数据挖掘中的应用_第2页
遗传算法在数据挖掘中的应用_第3页
遗传算法在数据挖掘中的应用_第4页
资源描述:

《遗传算法在数据挖掘中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第18卷第2期琼州学院学报2011年4月28日 Vol.18No.2JournalofQiongzhouUniversityApr.28,2011遗传算法在数据挖掘中的应用陈晓燕(琼州学院电子信息工程学院,海南三亚572022)摘要:遗传算法以其收敛速度快、时间短的特点,在科学研究中有着广泛的应用前景,重点介绍了遗传算法,并将其与数据挖掘技术相结合。最后,利用以上的结合方案,运用到一个实例中去。关键词:遗传算法;数据挖掘;技术;应用中图分类号:TP301.6文献标识码:A文章编号:1008-6722(2011)02-0015-030引言近年来,随着

2、计算机网络技术和数据库技术的发展,人们所拥有的信息量在急剧的增长,如何从海量的信息中深层次的发掘有价值的信息,是目前迫切解决的问题。在此情况下,一种新的数据分析技术应运而生———数据挖掘(DataMining)技术。应用于数据挖掘的算法很多,但都有一个造成算法局部收敛的共同弱点,而遗传算法在空间搜索过程中非常独立,弥补了其它算法在理论和应用上的许多缺陷。遗传算法应用在数据挖掘中,在各类问题的求解和应用中已表现出了它独特的优势。1数据挖掘技术对于数据挖掘技术,一种公认的定义是:数据挖掘技术是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中

3、,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。在很[]1多情况下,人们并不知道数据存在哪些有价值的信息,而数据挖掘技术可以帮助人们获得决策所需的多种知识,因此,研究数据挖掘技术有着重要的意义。应用于数据挖掘的方法有很多,常见的方法有以下几种:(1)人工神经网络人工神经网络是典型的机器学习方法,广泛应用于预测、模式识别、优化计算等领域,也可用于数据挖掘中的聚类分析。在结构上,人工神经网络方法是模仿生物神经网络,是一种通过训练来学习的非线性预测模型,可以完成分类、聚类、特征挖掘等多种数据挖掘任务。目前,神经网络主要有三种模型:

4、前馈式网络、反馈式网络、自组织网络。(2)关联规则挖掘技术关联规则挖掘技术是比较成熟的数据挖掘技术,它的目的是发现数据之间的关联特性,主要应用于数据挖掘中的关联分析。(3)决策树方法决策树方法以数据集中各字段的信息增益为依据,以信息增益最大的字段作为决策树的根结点,并依次对各个子树进行类似的操作,直到确定决策树的所有结点[]2。(4)遗传算法遗传算法(GeneticAlgorithm,GA)是模拟生物进化的自然选择和遗传机制的一种寻优算法。它先将搜索结构编码为染色体,然后分别通过选择、交叉、变异三个基本遗传算子对其进行循环操[]3作,遗传算法对于复

5、杂的优化问题无需建模和进行复杂运算,只需要利用遗传算法的算子就能寻找到问题的最优解或满意解。研究遗传算法在数据挖掘中的应用,对于进一步分析和研究演化计算,寻求高效的数据挖掘有着重要的理论意义。收稿日期:2011-01-15作者简介:陈晓燕(1984-),女,湖北武汉人,琼州学院电子信息工程学院助教,硕士,主要研究方向为无线传感网络.基金项目:琼州学院青年教师科研基金(QYQN201130);琼州学院青年教师科研基金(QY200920);三亚市院校地科技合作项目(2010YD49).1琼州学院学报(第18卷)620112基于遗传算法的数据挖掘遗传算法

6、操作的基本对象是染色体或个体,每个染色体代表求解问题的一个可能解。在应用遗传算法时,需要确定以下要素:(1)染色体的编码方法,如何由染色体的编码体现问题的解。(2)表示个体的适应度的评价函数。适应度高的个体有更大的概率遗传到下一代群体。(3)如何产生初始群体(4)确定遗传算子,即如何进行复制,交叉,变异等遗传操作并产生下一代群体。(5)确定运行参数,包括群体规模popsize,终止进化代数MaxGen,交叉概率PC和变异概率[]4Pm。图1表示了遗传算法的过程。2.1遗传操作的选择、交叉和变异3个基本算子轮盘赌选择:轮盘赌选择方法类似于博彩中的轮盘

7、赌。它先计算个体的相对适应值Pi=fin,这种选择策略可以如下实现:先生成一个[0,1]内的随机数∑fii=1r,若P+P01+…+Pi1<r<P0+P1+…+P,则选择个体ii,此处假设P=0。0交叉:是指对两个相互交叉的染色体按某种方式相互交换其部分基因,从而形成两个新的个体。它是产生新个体的主要方法。图2分别表示的是单点杂交和两点杂交。变异:是指将个体染色体编码串中的某些基因座上的基因值用该基因座的其他等位基因来替换,从而形成一个新的个体。图1标准的遗传算法图2单点杂交和两点杂交2.2编码DNA中遗传信息在一个长链上按一定的模式排列,也即进行

8、了遗传编码。遗传编码可以看作从表现型到遗传子型的映射。在遗传算法中,将n维决策向量X=[,,]T用xx…xX=[,,]T用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。