基于多元统计分析的聚类方法

基于多元统计分析的聚类方法

ID:33547226

大小:580.14 KB

页数:48页

时间:2019-02-27

基于多元统计分析的聚类方法_第1页
基于多元统计分析的聚类方法_第2页
基于多元统计分析的聚类方法_第3页
基于多元统计分析的聚类方法_第4页
基于多元统计分析的聚类方法_第5页
资源描述:

《基于多元统计分析的聚类方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、ClusteringMethodsApplicationsofMultivariateStatisticalAnalysisJiangshengYucSchoolofElectronicsEngineeringandComputerSciencePekingUniversity,Beijing,100871yujs@pku.edu.cn,http://icl.pku.edu.cn/yujsClusteringMethods–p.1/48Topics1.What'sclustering?2.SimilarityMeasures3.HierarchicalClusteringMetho

2、ds4.NonhierarchicalClusteringMethods5.MultidimentionalScaling6.CorrespondenceAnalysis7.BiplotsforViewingSamplingUnitsandVariables8.ProcrustesAnalysis:AMethod9.Conclusion10.ReferencesClusteringMethods–p.2/48ClusteringProblemExploratoryproceduresarehelpfulinunderstandingthecomplexnatureofmultiva

3、riaterelationships.Problem1Givenasetofdatafx2Rpg,satisfyingi1.thenumberofclassesisunknown;2.theclassofanyindividualisunknown.Weintendto1.definesomesuitablestatistics;2.clarifythenumberofclassesK;3.findareasonableclusteringmethod;and4.classifythedataintoKcategories.aaSo,clusteringisalsocalledunsu

4、pervisedclassi®cation.ClusteringMethods–p.3/48ExampleofClusteringPartitionagivensetbysomesimilarity:Figure1:fuzzyc-meansclusteringClusteringMethods–p.4/48ObservationMatrixGivennsamplepoints,eachhasmvariables:X1XjXmx1x11x1jx1m......xixi1xijxim......xnxn1xnjxnmmeanx1x

5、ixmstds1sismTable1:ObservationdataClusteringMethods–p.5/48NoBestClusteringMethod

6、}~•AKQJClusteringMethods–p.6/48ClusterMethods1.SystemMethod:mergethemostsimilarclasses,updatethedataandrepeattheproceduretillalldataareclassified.2.DynamicMethod:giveaninitialclassificationofdatafirstly,th

7、enadjusttheclassesbyleastvalueoflossfunctiontillnoimprovementcanmade.3.FuzzyMethod:forinstancefuzzyc-meansclustering,usuallyworkswellfordatawithfuzzycharacteristics.4.MethodofMinimumSpanningTree5.ClusteringMethods–p.7/48TransformationofDataCentralization:makethemean0,andthevariance-covarian

8、cematrixunchanged.xij=xijxj(1)S=S=(sij)mm(2)1Xn1Xnsij=(xtixi)(xtjxj)=xtixtj(3)n1n1t=1t=1Standardization:makethemean0,andsdt1.xijxjx=(4)ijsjClusteringMethods–p.8/48MeasuringSimilarity1.Distance(a)MinkowskiDistance(b)Stati

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。