基于网格密度的高精度聚类算法研究

基于网格密度的高精度聚类算法研究

ID:33752355

大小:2.08 MB

页数:44页

时间:2019-02-28

基于网格密度的高精度聚类算法研究_第1页
基于网格密度的高精度聚类算法研究_第2页
基于网格密度的高精度聚类算法研究_第3页
基于网格密度的高精度聚类算法研究_第4页
基于网格密度的高精度聚类算法研究_第5页
资源描述:

《基于网格密度的高精度聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、河北工业大学硕士学位论文基于网格密度的高精度聚类算法研究姓名:李静会申请学位级别:硕士专业:计算机应用技术指导教师:彭玉青20081101河北工业大学硕士学位论文基于网格密度的高精度聚类算法研究摘要数据挖掘又称数据库中的知识发现,是指从大型数据集中发现有趣的、有用的且预先未知的知识的过程。数据挖掘是数据库研究最活跃的领域之一,通过数据挖掘可以从大型数据集中提取可信、新颖、有效并易于理解的知识、规律或高层信息,这给人们在信息时代所积累的海量数据赋予了新的意义。随着数据挖掘技术的迅猛发展,作为其重要组

2、成部分,聚类分析和边界模式检测技术已经广泛应用于模式识别、数据分析、图像处理、市场研究等许多领域。而聚类和边界模式检测算法的研究也已经成为数据挖掘研究领域中非常活跃的一个研究课题。本文提出了参数自动化的基于网格密度的高精度的聚类算法。针对网格聚类算法的聚类结果对用户输入参数敏感这一问题,本文提出了一种参数自动化的处理方法;另外,本文还在结合了基于密度聚类算法和网格聚类算法的优点的基础上,采用计算低密度单元中的点到相邻高密度单元重心的欧几里德距离的方法来处理边界点,这种处理网格聚类边界的方法,克服了

3、由于网格单元内数据分布不均匀而造成聚类结果不准确的缺点,可以准确衡量出数据点的分布稠密程度趋势,从而达到使聚类结果更加准确的目的。同时,本文还在该算法的基础上提出了增量数据挖掘算法,能够对动态的数据库进行处理。实验结果表明:该算法可以有效的检测出任意形状、不同大小和不同密度聚类的边界点,并能有效的消除噪声。并且在该算法基础上提出的增量聚类算法在不影响聚类结果的前提下可以较高效率的处理数据的增量问题。关键字:聚类,网格,密度,边界,增量i基于网格密度的高精度聚类算法研究AnalysisofDensi

4、tyGrid-basedImprovingClusteringQualityAlgorithmABSTRACTDataminingalsocallsknowledge-discover,whichisaprocessofdiscoveringtheinteresting,usefulandunknownknowledgefromthehugedataset.Dataminingisoneofthemostactivitystudyofthedatabase.Itcanpick-upcreditab

5、le,original,effectiveandunderstandableknowledge,ruleandinformationthroughdatamining.Besides,clusteringanddealingboundaryarithmetichasbeenanactivestudyindata-miningfield.Thispapergivesanautomaticparameterandheighefficiencyarithmeticbasedongridanddensit

6、y.Thearithmetichastheexcellenceofarithmeticbasedongridandthearithmeticbasedondensity,andhasahigheffective.Thearithmeticdealswiththeboundarybythedistancebetweenthepointinlowdensitygirdandthecenterofgravityofthebordergridwhichcanexactscalethedata-distri

7、buting,sowecangetamorenicetyresult.Besides,thepaperalsogivesaincreaing-arithmeticwhichcandealwiththedynamicdata.Theresultshowsthat:thearithmeticcandealwiththeboundaryeffectively,andtheincreasing-arithmeticbasedonthisarithmeticcandealwiththedynamicdata

8、effectively.KEYWORDS:Clustering,Gird,Dentisyboundary,Increaing-dataii原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。学位论文作者签名:日期:关于学位

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。