分类数据聚类边界检测技术研究.pdf

分类数据聚类边界检测技术研究.pdf

ID:51200457

大小:1.94 MB

页数:52页

时间:2020-03-21

分类数据聚类边界检测技术研究.pdf_第1页
分类数据聚类边界检测技术研究.pdf_第2页
分类数据聚类边界检测技术研究.pdf_第3页
分类数据聚类边界检测技术研究.pdf_第4页
分类数据聚类边界检测技术研究.pdf_第5页
资源描述:

《分类数据聚类边界检测技术研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、AthesissubmittedtoZhengzhouUniversityforthedegreeofMasterResearchonClusterBoundaryDetectingTechnologyforCategoricalDataByB0WangSul:Prof.BaozhiOiuSuoervisor:rot.15aozhlUComputerSoftwareandTheorySchoolofInformationEngineeringMav2012学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得

2、的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。学位论文作者:王;j芝学位论文使用授权声明日期:)口,z年占月弓日本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学伊论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、缩印或者其他复制手段保存论

3、文和汇编本学位论文。本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。学位论文作者:互;皮日期:7‘,I≥年石,El≥日摘要随着互联网技术和信息技术的迅猛发展,人类社会进入了信息时代。信息时代的一个显著的特点就是人们所面对的信息和对信息的需求剧增。如何从这些信息中获取有用的知识是人们需要解决的一个问题。数据挖掘技术可以较好的满足人们对信息提炼的需求。聚类是数据挖掘中一个重要的分支,而聚类边界检测是对聚类的进一步的细化。聚类边界是一个新兴的研究方向具有广泛地应用前景,可

4、应用于生物学、传染病学、统计学、基因工程等多个领域。聚类边界是具有多个聚类特征的数据对象,对这类数据对象的研究具有实用价值。例如:进行产品市场调查时,可以通过对这类对公司产品感兴趣但并没有成为公司消费者的被调查者的信息特征进行分析,并相应调整公司营销策略来争取这类顾客,比盲目的争取那些对公司产品没有丝毫兴趣的消费者的成功率要高得多。聚类边界检测算法是一种提取该类数据对象的方法,本文针对现有聚类边界算法中的以下两个方面进行相关研究并取得相应的成果,具体如下:1.针对目前对聚类边界的研究主要集中在对数值类型数据的聚类边界的检测而尚未对分类数据聚类边

5、界进行相关研究的问题,本文对分类数据聚类边界进行了相关研究。给出了表征分类数据对象同所属类亲疏关系边界度定义和分类数据聚类边界的形式化定义,利用证据积累的思想提出了一种针对分类数据的聚类边界检测算法叫BORDER。在多个真实数据集上的实验结果表明算法可以有效的提取高维分类数据集中聚类的边界。2.针对现有算法对边界的提取精度不高和不能有效去除噪声的缺点,结合BRIM算法中的正、负半邻域思想和EDGE算法中的联合熵的思想的基础上提出了一种新的聚类边界检测算法叫BRIM。通过多个数据集上的实验的对比结果表明EBRIM算法在聚类边界提取精度和有效去除噪

6、声两方面都明显优于B刚M算法和EDGE算法。关键字:数据挖掘:聚类;边界点;分类数据;证据积累AbstractAbstract.WiththerapiddevelopmentofInternetandinformationtechnology,humansocietystepsintotheinformationage.Attheinformationage,anotablefeatureismessageswhichindividualsfaceeverydayareabundantanddemandsforinformationaleinc

7、reasing.HowtOextractusefulknowledgefromthesemessagesbecomesaproblemwhichshouldbesolvedbypeople.Dataminingtechnologyisagoodwaytoextracttheusefulinformationfrommessag,.3.。Clusteringisanimportantbranchofdatamining,clusterboundary.detectionisfurtherrefinementforclustering.Theclu

8、sterboundarydetectingtechnologyisannewemergingresearchfieldwhichhaswidelyap

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。