核密度估计及其在聚类算法构造中的应用

核密度估计及其在聚类算法构造中的应用

ID:37819518

大小:407.03 KB

页数:8页

时间:2019-05-31

核密度估计及其在聚类算法构造中的应用_第1页
核密度估计及其在聚类算法构造中的应用_第2页
核密度估计及其在聚类算法构造中的应用_第3页
核密度估计及其在聚类算法构造中的应用_第4页
核密度估计及其在聚类算法构造中的应用_第5页
资源描述:

《核密度估计及其在聚类算法构造中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第41卷第10期计算机研究与发展Vol141,No1102004年10月JOURNALOFCOMPUTERRESEARCHANDDEVELOPMENTOct12004核密度估计及其在聚类算法构造中的应用1,2111,2李存华孙志挥陈耿胡云1(东南大学计算机科学与工程系南京210018)2(淮海工学院计算机科学系连云港222005)(cli@hhit1edu1cn)摘要经典数理统计学中的核密度估计理论是构造基于数据集密度函数聚类算法的理论基础,采用分箱近似的快速核密度函数估计方法同样为构造高效的聚类算法提供了依据1通过对核密度估计理论及其快速分箱核近似方法的讨论,给出分箱近似密度估计相

2、对于核密度估计的均方误差界,提出基于网格数据重心的分箱核近似方法1在不改变计算复杂度的条件下,基于网格数据重心的分箱核近似密度函数计算可以有效地降低近似误差,这一思想方法对于构造高效大规模数据聚类分析算法具有指导意义1揭示了基于网格上密度函数近似的聚类算法与核密度估计理论之间的关系1关键词核密度估计;分箱规则;聚类算法中图法分类号TP391KernelDensityEstimationandItsApplicationtoClusteringAlgorithmConstruc2tion1,2111,2LICun2Hua,SUNZhi2Hui,ChenGeng,andHuYun1(De

3、partmentofComputerScienceandEngineering,SoutheastUniversity,Nanjing210018)2(DepartmentofComputerScience,HuaihaiInstituteofTechnology,Lianyungang222005)AbstractKerneldensityestimationprovidessolidfoundationfordensitybasedclusteringalgorithmcon2struction1Whilebinnedapproximationisshowntobeaneffic

4、ientmechanismforfastkerneldensitycompu2tation,itisalsoproventobeapromisingapproachtoconstructrobustclusteringalgorithms1Thispaperdealswithformationandaccuracyofthebinnedkerneldensityestimators,presentsmeansquarederrorboundsfortheclosenessofsuchestimatorstotheunbinnedkerneldensityestimators1Toim

5、provetheaccu2racyofthebinningmethod,anaÇvegrid2levelapproximateddensityestimatorisconstructed,followedbyadetailedproofofitsmeansquarederrorbounds1Theimprovedapproachconstructsbinneddensityestimatorbysubstitutingthecenterofagridwiththegravitycenterofthedatapoints,whichresultsinbetteresti2mationa

6、ccuracywithoutlossofcomputationefficiency1Asamainconcern,thecloserelationbetweenthedensity2basedclusteringalgorithmsandthekernelestimationmethodsisrevealed1Keywordskerneldensityestimation;binningrule;clusteringalgorithm和工具,是人们认识和探索事物之间内在联系的有1引言效手段,具有强大的功能和十分广泛的应用领域1正因为如此,该技术一直受到研究者的重视并得到聚类分析是数据

7、挖掘技术的基本而重要的方法广泛深入的研究1近年来,众多研究者运用不同的收稿日期:2004-07-15基金项目:国家自然科学基金项目(70371015);国家科技部中小型企业创新基金项目(02C26213210070);江苏省教育厅自然科学基金项目(02KJB520012)10期李存华等:核密度估计及其在聚类算法构造中的应用3171理论工具或基于不同的应用目的构造了一系列具有不难发现,这种聚类构造方法在理论上与统计学中重要应用价值的有效算法1然而,实际问题的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。