欢迎来到天天文库
浏览记录
ID:37072101
大小:813.69 KB
页数:75页
时间:2019-05-17
《模糊粗糙支持向量聚类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:密级:________________UDC:编号:________________理学硕士学位论文模糊粗糙支持向量聚类方法研究硕士研究生:魏士鹏指导教师:邓廷权教授学科、专业:应用数学论文主审人:张晓威教授哈尔滨工程大学2018年3月分类号:密级:________________UDC:编号:________________理学硕士学位论文模糊粗糙支持向量聚类方法研究硕士研究生:魏士鹏指导教师:邓廷权教授学位级别:理学硕士学科、专业:应用数学所在单位:理学院论文提交日期:2018年1月论文答辩日期:2018年3月学位授予单位:
2、哈尔滨工程大学ClassifiedIndex:U.D.C:ADissertationfortheDegreeofM.ScienceResearchonFuzzyRoughSupportVectorClusteringMethodCandidate:WeiShipengSupervisor:Prof.DengTingquanAcademicDegreeAppliedfor:MasterofScienceSpecialty:AppliedMathematicsDateofSubmission:Jan.2018DateofOralExamin
3、ation:Mar.2018University:HarbinEngineeringUniversity哈尔滨工程大学学位论文原创性声明本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。有关观点、方法、数据和文献的引用已在文中指出,并与参考文献相对应。除文中已注明引用的内容外,本论文不包含任何其他个人或集体已经公开发表的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者(签字):日期:年月日哈尔滨工程大学学位论文授权使用声明本人完全了解学校保护知
4、识产权的有关规定,即研究生在校攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨工程大学有权保留并向国家有关部门或机构送交论文的复印件。本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文,可以公布论文的全部内容。同时本人保证毕业后结合学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈尔滨工程大学。涉密学位论文待解密后适用本声明。本论文(□在授予学位后即可□在授予学位12个月后□解密后)由哈尔滨工程大学送交有关部门进行保存、汇编等。作者(签字):导师(签字)
5、:日期:年月日年月日摘要在智能技术飞速发展的今天,各行各业的数据规模呈几何级数的增长。如何从海量数据中挖掘潜在的有用信息成为人们关注的焦点。聚类分析是数据挖掘技术的一个重要分支,其中的支持向量聚类(SVC)是一种基于轮廓的聚类分析算法。SVC的基本原理是通过建立某些准则,确定在原始数据空间描述簇轮廓的样本点,称之为支持向量。并对支持向量按照某些策略进行标记,标记相同的支持向量在原始数据空间中围成一个簇。虽然支持向量聚类已经得到广泛的应用,但仍存在不能很好地处理簇与簇交叠、对参数敏感、时间复杂度较高等问题。本文在经典支持向量选取策略基础上
6、,通过分别考虑数据的局部密度和模糊粗糙集模型,提出了基于kNN连通度的支持向量选取策略和基于模糊粗糙集的支持向量选取策略。在谱聚类标记方法(SCLM)的基础上,本文通过兼顾原始数据空间中数据的近邻关系,提出了一种改进的支持向量谱聚类标记方法(MSCLM),并在此基础上,构建了一种新的低时间复杂度的支持向量标记方法(NLM)。本文的具体研究内容如下。针对支持向量选取存在冗余问题,本文通过计算每个样本点的局部密度,确定一种自适应的局部密度阈值,选取局部密度小于等于该阈值的样本点作为支持向量候补集,在这个集合上选取支持向量。针对簇与簇接近或重
7、叠和簇内样本点分布不均匀的数据集,本文构建一种模糊粗糙集模型,通过计算每个样本点的模糊粗糙集上近似为样本点赋予权值,使簇间稀疏样本点被判定为边界支持向量,有效地避免了簇内稀疏样本点被选为支持向量。理论表明,该方法确定的支持向量在原始数据空间中表现为同簇距离较近,异簇距离较远,而在高维特征空间中,同簇支持向量间角度较小,异簇角度较大。针对SCLM中FCM聚类结果不能真实完全反映原始数据集分布情况的问题,本文在原始数据空间中引入了样本点间的近邻关系度量,用此度量对FCM聚类标记结果进行后续处理,提出了一种改进的支持向量标记方法(MSCLM)
8、,该方法提高了支持向量标记的准确性和数据聚类精度。为了降低支持向量标记的时间复杂度,本文基于支持向量间的空间关系提出了一种简化的支持向量标记方法(NLM)。本文分别对MSCLM、NLM两种标记方法做效果分析
此文档下载收益归作者所有