欢迎来到天天文库
浏览记录
ID:20851708
大小:5.39 MB
页数:38页
时间:2018-10-17
《粗糙集和蚁群优化方法在特征选择中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、第一章绪论.3.在分析基于粗糙集的特征选择方法和基于蚁群优化方法的特征选择算法所具有的优势和存在不足的基础上,本文提出了一种基于粗糙集蚁群优化方法的特征选择算法。所提出的算法通过引入粗糙集相对核属性作为特征选择的起点,以便提高算法的准确性;在转移规则和信息素更新策略中,引入了粗糙集属性依赖度和属性重要度,用于指导蚂蚁的搜索过程,以便提高算法的性能;此外,将粗糙集理论的分类精度和特征子集长度两个参数应用于评价函数中,以衡量特征子集的优劣。.4.对所提出的特征选择算法在给定的数据集上进行测试,证明算
2、法的性能。通过比较分析,验证该算法的可行性和合理性。1.4论文的组织与结构第一章是绪论。主要介绍了本文的研究背景及意义,特征选择方法的研究现状和本文研究的主要内容。第二章是粗糙集理论和蚁群优化算法的相关知识。在本章中详细介绍了粗糙集理论的基本概念,包括信息表达系统,上近似和下近似,属性约简与核,属性依赖度和重要度等概念;此外,对蚁群算法的理论知识进行了总结概述。第三章是特征选择算法的研究与分析。本章对特征选择的一般算法进行了比较,着重对基于粗糙集属性重要度的特征选择算法(贪婪法)和基于蚁群优化方
3、法的特征选择算法进行了深入研究,通过分析各种算法的优劣,本文提出了一种将粗糙集和蚁群优化算法各自优势相结合的特征选择算法。第四章是基于粗糙集和蚁群优化算法的特征选择算法。本章对粗糙集一蚁群优化方法的特征选择算法进行了详细的介绍和分析。包括算法的基本思想,算法具体步骤设计和实现方法。为了减少搜索的盲目性,增加结果的准确性,本为将相对核作为特征选择的起点。另外,利用粗糙集的属性依赖度和属性重要度方法来构建蚁群遍历的转移规则,增强了算法的性能;利用特征子集长度和分类性能结合控制信息素的更新策略,不仅发
4、挥了蚁群算法的正反馈优势,而且可以使特征选择的任务朝着最优的方向进行。最后通过实验分析证明了算法的可行性。第五章是总结与展望。包括对本文工作的总结和下一步工作的方向,5第二章粗糙集理论和蚁群算法的相关知识第2章粗糙集理论和蚁群算法的相关知识粗糙集理论(RoughSetTheory)是由波兰学者Z.Pawlark教授提出的一种处理不完备、不确定、不确定和模糊问题的数学工具H1。粗糙集的主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策和分类规则。其优势在于不需要任何先验知识,就可以
5、发现信息系统中潜在的知识,揭示隐含的规律。经过短短20余年的发展,粗糙集理论在理论和应用领域都取得了显著的研究成果。目前,粗糙集理论已经成功应用于决策分析、医疗诊断、信息检索、机器学习和模式识别等方面。+。蚁群优化算法(ACO)是一种近年来才发展起来的新颖的仿生型的智能优化算法,具有正反馈、分布计算和启发性搜索等特点。蚁群优化算法的思想来源于我们真实世界中的蚂蚁群体觅食行为的智能特性。在现实生活中,许多蚂蚁所构成的蚂蚁群体在经过一段时间的调整以后,通过个体之间的相互配合与协作,最后能够使整个蚁群
6、沿着某条最短的路径将食物搬回到蚁巢。作为计‘算智能和群智能的重要分支之一,蚁群优化算法的研究方兴未艾,备受瞩目。本章将介绍粗糙集理论和蚁群算法的相关知识,为后文研究粗糙集和蚁群优化方法相结合的特征选择方法提供理论基础。2.1粗糙集的基本理论I}"/12.1.1信息表知识表达系统智能系统的关键之一就是知识表达。所谓知识获取是指将知识从一种表达形式转化为另一种目标表达形式的过程,从而从原始海量的信息中提取有价值、有规律的信息。知识表达系统又称为信息系统,是用关系表的形式表达的。关系表的行对应要研究的
7、对象,列对应对象的属性,对象的信息通过指定对象的各属性值来表达。形式上,p.1元组J=(U,4;V,f)是一个知识表达系统,其中U:对象的非空6第二章粗糙集理论和蚁群算法的相关知识有限集合,称为论域;A:属性的非空有限集合;矿;UIra,Va是属性a的值域;正UxAjV是一个信息函数,它为每个对象的每个属性赋予一个信息值,即'qa∈A,x∈U,f(x,a)∈Va;通常A=CUD,C为条件属性的集合,D为决策属性的集合。通常也用S=(U,彳)来代替S=缈,A,V,。厂)。粗糙集理论认为知识与分类是
8、密不可分的,知识是基于对研究对象的一种分类的能力,分类的过程就是将相差不大的对象分为一类,他们的关系就是不可分辨关系,也称为等价关系。等价关系定义如下:令S=(u,/4,圪/)是一个信息系统,令P互A,定义P的不可区分关系ind(P)为ind(P)--.{(x,Y)∈UxUIVa∈P,f(x,口)=f(Y,口)}。如果(x,Y)∈ind(P),贝lj称X和y是P不可区分的。用符号【z】p表示x∈U的P等价类。由此可见,在信息系统中,一个属性对应一个等价关系,一个表可以看做是定义的一簇等价关系,即
此文档下载收益归作者所有