欢迎来到天天文库
浏览记录
ID:33727111
大小:4.19 MB
页数:93页
时间:2019-02-28
《不确定性数据挖掘算法设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、论文题目不确定性数据挖掘算法设计学科专业计算机系统结构指导教师文军副教授作者姓名李晓丽学号200820601035万方数据分类号密级注1UDC学位论文不确定性数据挖掘算法设计(题名和副题名)李晓丽(作者姓名)指导教师姓名文军副教授电子科技大学成都(职务、职称、学位、单位名称及地址)申请专业学位级别硕士专业名称计算机系统结构论文提交日期2011.03论文答辩日期2011.05学位授予单位和日期电子科技大学答辩委员会主席评阅人年月日注1:注明《国际十进分类法UDC》的类号。万方数据独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所
2、知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名:日期:年月日关于论文使用授权的说明本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此
3、规定)签名:导师签名:日期:年月日万方数据摘要摘要传统的数据挖掘解决了海量数据贫乏知识的情况,但是传统的数据挖掘只适合于准确的数据,它没有考虑到数据的不确定性,然而不确定性是客观事物本身所固有的一种特性,数据挖掘如果没有考虑到数据的不确定性,那么最后的挖掘结果可能是错误的。随着不确定性数据的增多,迫切需要针对于不确定性数据的数据挖掘。在不确定性数据上进行挖掘的技术就是不确定性数据挖掘。在不确定性数据挖掘中,模糊不确定性数据的聚类分析研究和应用最广泛,模糊不确定性是指事物没有明确的外延。本文研究模糊聚类的FCM算法并将其作用在图像分割领域中进行实验和分析。图像分割本质
4、是把图像中相似的像素聚为一类,不相似的像素分离,由于成像的误差和人类视觉的特性造成图像的模糊性,而且图像分割需要一种自动化的算法,聚类算法作为一种无监督的算法可以很好地满足这个需求,所以模糊聚类可以很好地作用于图像分割领域中。FCM算法在图像分割中的应用很广泛,但是它本身存在许多不足之处,比如计算量太大,速度慢,对初始值敏感,容易陷入局部极值,收敛性差,迭代次数多,而且对于任何的数据和初始值,FCM算法总会给出一个结果,但是它却无法判断聚类结果的好坏。针对FCM的这些缺点,本文提出了一种改进的FCM对图像进行分割:为了解决速度问题,本文对图像数据进行量化,灰度图像采
5、用特征向量的方法,用灰度级统计值作为权值,彩色图像采用颜色集量化的方法,用量化后的颜色集的统计值作为权值,把计算量进行压缩,对压缩后的数据采用加权计算的方法,即能保证分割结果的准确度,也能提高速度;用加权的减法聚类对量化后的数据进行近似聚类,不仅可以自动确定聚类的最大聚类数目,还可以得到每个聚类数所对应的聚类的初始中心,这些初始中心都是密度指标最大的数据点,比较接近于真正的聚类中心,因此可以避免了初始值不当,迭代次数大,陷入局部极值的情况;用基于可能分布的聚类有效性函数判断聚类结果,得到有效性最好的聚类数目。本文通过实验证明,本文所提出的算法不仅保证了准确度和有效性
6、,而且比FCM算法速度提高了几百倍,迭代次数也大大减少了。关键词:不确定性,数据挖掘,模糊聚类,图像分割I万方数据ABSTRACTABSTRACTTraditionaldatamininghassolvedtheproblemofhugeamountsofdatawithpoorknowledge.However,itisjustsuitableforaccuratedata.Becauseuncertaintyisaninherentfeatureofobjectivethings,theresultofdataminingmaynotberightwithout
7、takingintoaccountofuncertainty.Withuncertaindataincreasing,weneedDataMiningthattakesintoaccountofuncertaintyurgently.UncertainDataMiningcanmineinuncertaindata.IntheresearchfieldofUncertainDataMining,theClusterAnalysisandapplicationofthefuzzyuncertaindataisthemostwidelyusedtechnology.
此文档下载收益归作者所有