面向高维数据的动态随机投影三支聚类方法研究

面向高维数据的动态随机投影三支聚类方法研究

ID:77972107

大小:1.92 MB

页数:62页

时间:2022-01-30

面向高维数据的动态随机投影三支聚类方法研究_第1页
面向高维数据的动态随机投影三支聚类方法研究_第2页
面向高维数据的动态随机投影三支聚类方法研究_第3页
面向高维数据的动态随机投影三支聚类方法研究_第4页
面向高维数据的动态随机投影三支聚类方法研究_第5页
面向高维数据的动态随机投影三支聚类方法研究_第6页
面向高维数据的动态随机投影三支聚类方法研究_第7页
面向高维数据的动态随机投影三支聚类方法研究_第8页
面向高维数据的动态随机投影三支聚类方法研究_第9页
面向高维数据的动态随机投影三支聚类方法研究_第10页
资源描述:

《面向高维数据的动态随机投影三支聚类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号TP391密级公开UDC004.62学位论文编号D-10617-308-(2017)-02097重庆邮电大学硕士学位论文中文题目面向高维数据的动态随机投影三支聚类方法研究英文题目StudyonThree-wayDecisionClusteringAlgorithmsbasedDynamicRandomProjectionforHighDimensionalData学号S140201102姓名张海波学位类别工学硕士学科专业计算机科学与技术指导教师于洪教授完成日期2016年5月19日重庆邮电大学硕士学位论文摘

2、要摘要在大数据时代如何快速正确挖掘海量高维数据资源中蕴藏的信息价值是当今的焦点,聚类分析广泛应用于识别海量高维数据中的结构信息,因此,高维数据聚类成为了聚类研究领域当中的热点问题。除了属性维度增加带来的“维度灾难”以外,在社交网络、生物信息处理与电子商务等高维复杂数据的实际应用中,因为数据本身具有不确定性信息,数据对象和簇的关系有以下三种可能:确定属于或确定不属于,可能属于也可能不属于。为了提高聚类的准确性,保留数据之间的不确定性关系,需要高维聚类算法具有处理不确定性数据的能力,能够对簇与簇之间的边界数据点进行

3、不确定性的处理,同时对簇内的关系紧密程度进行一个详细的划分。因此,本文提出利用三支聚类方法来研究面向高维数据及其不确定性聚类。1.本文首先提出了面向高维数据的动态随机投影的三支聚类模型。该模型动态地将原始高维数据投影到属性维度由低到高的多个子空间中进行聚类,比较相邻两个空间的聚类结果,从中选取较好的聚类结果进行保留,同时计算目标函数值是否满足算法停止条件,若不满足,增加属性维度并投影聚类,比较本次聚类结果与上次较好聚类结果并选出较好的结果保留,计算目标函数值,直到目标函数值满足停止条件,算法停止,输出一个综合考

4、虑聚类质量与计算代价平衡的聚类结果。2.提出基于随机投影的三支k-medoids动态聚类方法。为了验证模型的可行性和有效性,提出了基于随机投影的三支k-medoids动态聚类方法,该方法提出了具体的基于k-medoids的三支决策聚类算法以及定义了计算模型当中的目标函数。在基于k-medoids的三支决策聚类算法中应用新的阈值和设置方法,只设置一对参数自动计算每个类的决策阈值和,根据类簇的不同获得不同的阈值对,在将数据对象划分到类的正域、边界域或者负域时比设置一对全局决策阈值更合理。3.提出改进的动态随

5、机投影三支聚类方法。该方法是针对基于随机投影的三支k-medoids动态三支聚类方法的改进方法。该方法提出了基于密度峰值的三支决策聚类算法,重新定义了目标函数,改进了基于随机投影的三支k-medoids动态聚类方法中动态随机投影时不能根据聚类结果自动调整增加的维度大小的问题。利用该方法I重庆邮电大学硕士学位论文摘要进一步验证模型的有效性与可行性。实验表明,本文提出的两种算法都是有效的,且相较一些传统的二支决策聚类算法,本文提出的两种三支聚类方法能够显著提高聚类正确率。关键字:三支聚类;三支决策;动态;随机投影;

6、高维数据;II重庆邮电大学硕士学位论文AbstractAbstractIntheeraofbigdata,howtoquicklyandcorrectlyminethevalueofinformationcontainedindataresourcesisthefocusoftoday.Clusteringanalysisiswidelyusedtoidentifythestructuralinformationinthemassivehigh-dimensionaldata.Therefore,themeth

7、odsofclusteringforhigh-dimensionaldatahavebecomeahotanddifficultissueinthefieldofclusteringresearch.Besidesof“theCurseofDimensionality”causedbytheattributes’dimensionsincreasing,theactualapplicationsofcomplexhigh-dimensionaldatainsomeareassuchassocialnetwork

8、s,biologicalinformationprocessingandelectroniccommerce,therearethreepossiblerelationshipsbetweendataobjectsandclustersbecauseofthedata’suncertaininformation.Thedataobjectisdefinitelyamemberofthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。