欢迎来到天天文库
浏览记录
ID:33904546
大小:4.63 MB
页数:148页
时间:2019-02-28
《基于自然计算的模糊聚类新算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、西安电子科技大学博士学位论文基于自然计算的模糊聚类新算法研究姓名:李洁申请学位级别:博士专业:电路与系统指导教师:焦李成20041001摘’要数据挖掘技术是近年来国际上在信息决策领域最前沿和最活跃的研究方向之一。作为数据挖掘的一种强有力的分析工具,聚类分析得到了人们的广泛关注。聚类分析是多元统计分析的方法之一,也是统计模式识别中非监督模式分类的一个重要分支,近二十年来得NT迅猛的发展,有许多聚类分析新算法不断被提出。自然计算是目前新兴的一类计算方法,它以自然界,特别是生物体的功能、特点和作用机理为基础设计出的计算模
2、型。它具有自适应、自组织、自学习等能力,能够解决传统计算方法难于解决的许多复杂问题,因而近年来成为研究的热点,并在诸多领域中得到了广泛的应用。针对现有聚类分析算法在数据挖掘应用中存在的不完善甚至严重不足之处,本文结合自然计算方法,对传统模糊聚类算法进行较为系统的改造和革新,主要探讨了有关具有混和属性特征数据的聚类算法目标函数的定义以及优化方法,提出了适合大数据集的网络结构聚类新算法,扩展了聚类分析的应用范围,并构造了适合于数据挖掘的新的聚类有效性函数。实验结果表明,本文提出的一系列有关模糊聚类分析的新思想和新方法都
3、取得了良好的效果。归纳起来,本文的研究成果主要表现在以下几个方面:1.定义了一个新的相异性匹配测度,修正了传统聚类算法的目标函数——类散布矩阵的迹,将数据集中不同属性特征相结合,构成新的聚类目标函数,使得其能够适合混合类属特征的数据,并利用遗传算法对其进行优化,克服传统的模糊“均值(FKM)算法对原型初始化敏感的缺点,使得算法能够以较高的概率收敛到全局最优解。2.利用人工免疫系统中著名的克隆选择算法改进遗传算法,避免了遗传算法中可能出现的早熟现象,同时由于基于克隆算子的克隆选择算法是群体搜索策略,本质上固有并行性和
4、搜索变化的随机性,在搜索中不易陷入局部极值,最终能以概率1获得问题的全局最优解,而且收敛速度比遗传算法更快,因此更加适合大数据集的聚类分析。3.结合人工免疫系统中免疫网络理论,提出用免疫网络来进行聚类分析,由于所获得的网络神经元代表了数据子集中的典型样本,因而可以用来产生相应的数据子集;通过最小生成树对获得的网络神经元的连接权进行分析,最终自动解决了FKM类型算法需要事先输入类别数以及聚类原型必须一致的难题。4.借鉴生物免疫系统的免疫应答中禁忌克隆的现象,提出禁忌克隆算法,并与克隆选择算法相结合,形成基于克隆算法的
5、网络结构聚类分析新算法。由于新算法将克隆选择与禁忌克隆相结合,使得到的网络即具有免疫的特异性又具有免疫耐受性,因此具有有效的清晰网络结构,从而使网络结构聚类算法对数据集边界点以及噪声点不再敏感。5.利用免疫系统中有限资源理论,设计了一种模糊识别球,使其作用范围随刺激水平的变化而变化,通过对B细胞的竞争,将刺激水平低的识别球清除,使网络对模糊边界点不敏感,从而能够代表各类的典型样本,使得到的网络具有清晰的结构,同时大大提高运算效率,解决了网络规模随迭代次数以及运行时问随数据量呈指数增长这一难题,使基于网络结构的聚类算
6、法更适合大数据集聚类分析。6.由于对聚类分析而言,聚类有效性问题经常可以转化为最佳类别数k的自动确定。所以我们提出划分模糊度这一新概念,同时兼顾数据集的模糊划分信息和几何结构信息,将模糊划分熵与划分模糊度相结合,定义了一种修正的划分模糊度作为聚类有效性函数。这种新的聚类有效性函数不仅能够有效地分析数值型数据分类结果的合理性,而且对类属型数据也是有效的。并基于此,提出两种分别适合于数值型数据和类属型数据的参数优选方法。本文的工作受到国家自然科学基金和国家“863”计划的资助。关键词:数据挖掘,模糊聚类分析,自然计算,
7、数值特征,类属特征,克隆选择禁忌克隆,模糊识别球,聚类有效性ABSTRACTInrecentyears,dataminingisbecomingoneofthemostadvancedandactiveresearchtopicsinthefieldoftheinformationdecision—makingintheworld.Asaneffectivetoolofdatamining,clusteranalysisisattractingwideaRention.Clusteringisoneofmethod
8、sofmultivariantstatisticalanalysis,andoneofimportantbranchesofunsupervisedclassificationinstatisticalpatternrecognition.Intherecenttwodecades,clusteranalysisismaderapiddevelopment,
此文档下载收益归作者所有