欢迎来到天天文库
浏览记录
ID:27719248
大小:311.50 KB
页数:6页
时间:2018-12-05
《试论数据挖掘中的遗传算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、试论数据挖掘中的遗传算法张帆南京财经大学022近年来,数据挖掘引起了信息产的、随机的实际数据中提取隐含在其摘要本文对数据挖掘进行了概述,阐明业界的极大关注,其主要原因是由于广中的、人们不知道的、但又是潜在有用了数据挖掘的概念、数据挖掘在商泛存在可以使用的大量数据,并且迫切的信息和知识的过程;从商业的角度来业中的意义。如何进行数据挖掘及需要将这些数据转换成有用的信息和知看,数据挖掘是一种崭新的商业信息处数据挖掘流程,提出了数据挖掘技术识,从而被商务管理、生产控制、市场理技术,其主要的特点是对商业数据库中的一个重要算法-遗传算法的基本分析、工程设计和科学探索等应用。通中大量业务数据进行抽
2、取、转化、分析原理以及遗传算法在数据挖掘技术中过研究数据挖掘,为决策者提供了重要和模式化处理,从中提取辅助商业决策的地位。提出了基于遗传算法的关的、极有价值的信息或知识,带来不可的关键知识,即从一个数据库中发现相联规则的提取方法。文章还给出了估量的效益。主要表现在它为大量数据关商业模式[2]。简单地说,数据挖掘用遗传算法进行关联规则挖掘的实的利用提供了有效工具,将数据坟墓转就是在数据中发现模式。例,并讨论了数据挖掘技术所面临换成知识“金块”。数据挖掘涉及的学科1.2数据挖掘方法的问题和挑战。领域和方法很多。这门新兴的边缘科学数据挖掘的技术方法不断地更新发关键词结合了统计学、机器学习、
3、模式识别、展。至今,常用的有以下几种:数据挖掘;遗传算法;关联规则(1)决策树方法智能数据库、知识获取、人工智能、专Abstract家系统、数据可视化及高性能计算等领用树形结构表示决策集合,利用信Firstly,thispapercommentsdata域。它已吸引了计算机科学家、工程技息论中的互信息(信息增益)寻找数据库mining,explainswhatisdataminin,g术人员、认知科学家和统计学家的极大中具有最大信息量的字段建立决策树的whyandhowtodoit,themain兴趣。一个结点,再根据字段的不同取值建立processofdataminingandso
4、.on遗传算法作为数据挖掘的一种重要树的分支;在每个分支子集中重复建立Secondly,animportantmethodgenetic algorithms(GA)indataminingis算法,在解决大空间、多峰值、非线性、树的下层结点和分支,即可建立决策全局优化等高复杂度问题时显示了独特树。introduced,andtheorigin,的优势,它是J.H.Holand于1975(2)人工神经网络方法development,maintheoryandsoonarebrieflydescribed.Onthisbasi,sthispaperbringsforwardthealg
5、orithmsbased年提出的一种基于进化论的原理发展起来的高效的随机搜索与优化的方法,其应用范围几乎涉及到用传统的优化方法它从结构上模仿生物神经网络,是一种通过训练来学习的非线性预测模型,可以完成分类、聚类、特征挖onthegeneticalgorithmsofassociationrules.AssociatedwiththeStudentAdministrationSystem,thispapergives难以解决的优化问题,在工业工程、经济管理、交通运输、工业设计等许多领域里获得了广泛的应用。掘等多种数据挖掘任务。这种方法是以MP模型和Hebb学习规则为基础,用神经网络连接
6、的权值表示知识,其thealgorithmsandprogramofmining 学习方法表现在神经网络的权值修改 1、数据挖掘综述associationrulebasedongeneticalgorithms.Lastly,thispaperpointsoutchallengesofdatamini,ngsummarizestheworkofthispaperandtheworkinthefutur.eKeywordsDataMining;GeneticAlgorithms;AssociationRule1.1数据挖掘定义数据挖掘,又称为数据库中知识发现(KnowledgeDisc
7、overyfromDatabase,简称KDD),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识。的复杂过程[1]。从技术角度看,数据挖掘是从大上。神经网络方法主要应用于数据挖掘的聚类技术中。(3)遗传算法这是模拟生物进化过程的算法,由三个算子组成:a.繁殖(选择)这是一个从旧种群(父本)中选出生命力强的个体,产生新种群(后代)的过程。量的、不完全的、有噪声的、模糊-119-信息科技中国科技信息2006年第19期CHINASCIENCEAN
此文档下载收益归作者所有