欢迎来到天天文库
浏览记录
ID:32369898
大小:1.50 MB
页数:57页
时间:2019-02-03
《一般分布区间型符号数据som聚类地分析地研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得天津大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名:签字日期:年月日学位论文版权使用授权书本学位论文作者完全了解天津大学有关保留、使用学位论文的规定。特授权天津大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印
2、、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:导师签名:签字日期:年月日签字日期:年月日摘要随着互联网技术的高速发展和信息化进程加快,社会的数据量呈现爆炸式增长,给传统的数据挖掘和分析技术带来新的挑战。符号数据分析技术(SDA,SymbolicDataAnalysis)基于“数据打包”的思想针对海量数据的处理提供了一套知识发现和规律挖掘的理论方法。区间型符号数据是SDA中最常见的一类符号
3、数据,应用也最为广泛。聚类分析作为一种无先验知识情况下对复杂数据关系进行分析处理的技术是数据挖掘技术的一个重要的研究分支,并在符号数据分析领域有着广泛的应用。源自神经网络的自组织映射(SOM,Self-OrganizingMap)方法由于其拓扑保序和可视化等特点在聚类分析中有其独特的优势。现有的对区间型符号数据聚类分析的研究,多建立在打包构成区间数的原始数据服从均匀分布的假设的基础上,但实际情况往往不能满足这一理想假设。针对此问题,本文考虑放松原始数据分布的假设,针对一般分布的区间型符号数据的表示
4、方法和距离度量以及在SOM聚类分析中的应用展开研究。首先给出了符号数据的基本概念,重点介绍了区间型符号数据的descriptivestatistics,基于一般分布的假设,区别于传统均匀分布假设的区间数,给出了一般分布区间数的定义和特点概括。考虑区间数(Interval)中所包含的个体的分布(distributionofindividuals)信息,本文提出了一般分布的区间型符号数据的一种新的表示方法,并阐述了与传统均匀分布的区间型符号数据的表示方法之间的联系与区别。在区间数的新的表示方法的基础上
5、,基于传统的city-block距离给出了一般分布区间型符号数据的距离度量。并基于该距离度量给出了一般分布区间型符号数据的SOM聚类算法。随机模拟试验的结果表明,基于一般分布假设并采用本文提出的表示方法和距离度量的SOM聚类算法的有效性优于基于均匀分布假设并采用传统Hausdorff距离度量的SOM聚类算法。最后将本文提出的聚类算法在我国的气象数据集上做了应用研究,进一步说明了本文算法可以有效地解决实际问题,具有一定的实用价值。关键词:区间型符号数据一般分布符号数据分析聚类分析自组织映射ABSTR
6、ACTWiththerapiddevelopmentofInternetandtheacceleratedprocessofinformatizationineveryfieldofsociety,theamountofdataisshowingexplosivegrowthnowadays,whichbringsnewchallengestotraditionaldataminingandanalysistechnologies.Basingonthethoughtof"datapackagin
7、g",Symbolicdataanalysistechniques(SDA)providesasetofmethodsandtheoriesforknowledgediscoveryofmassivedata.SymbolintervaldataisthemostcommonformofdataforSDA,whichalsohasthemostextensiverangeofapplications.Clusteranalysis,asausefultooltoanalysecomplexdat
8、arelationshipsundernon-prioriknowledge,isanimportantdataminingtechnologyresearchbranch,andhasbeenwidelyappliedinthefieldofsymbolicdataanalysis.Stemmingfromneuralnetworks,Self-OrganizingMap(SOM)methodhasitsuniqueadvantagesinclusteringanalysisbe
此文档下载收益归作者所有