Applied_Multivariate_Data_Analysis_ch10.pdf

Applied_Multivariate_Data_Analysis_ch10.pdf

ID:34659133

大小:665.91 KB

页数:14页

时间:2019-03-08

Applied_Multivariate_Data_Analysis_ch10.pdf_第1页
Applied_Multivariate_Data_Analysis_ch10.pdf_第2页
Applied_Multivariate_Data_Analysis_ch10.pdf_第3页
Applied_Multivariate_Data_Analysis_ch10.pdf_第4页
Applied_Multivariate_Data_Analysis_ch10.pdf_第5页
资源描述:

《Applied_Multivariate_Data_Analysis_ch10.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第十章集群分析(ClusterAnalysis)將比較相似的樣本聚集在一起,形成集群(cluster)。以『距離』作為分類的依據,『相對距離』愈近的,『相似程度』愈高,歸類成同一群組。此統計分析方法不需要任何的假設。集群分析可分成分層法(Hierarchical)、非分層法(Nonhierarchical)和兩階段法。1.分層法有凝聚分層法(Agglomerative)和分離分層法(Divisive)。『距離』可分為『點間距離』和『群間距離』。『點間距離』:歐氏距離(EuclideanDistance):馬氏距離(MahalanobisDistance)

2、:城市街距離(CityBlockDistance):(1)凝聚分層法(Agglomerative):開始時每一個體為一群,然後最近的兩個體合成一群,一次結合使群組越變越少,最後所有個體結合成一群。依不同的『群間距離』分為,(A)最近法(單一聯結法SingleLinkage):d=MindA,Biji∈Aj∈B(B)最遠法(完全聯結法CompleteLinkage):d=MaxdA,Biji∈Aj∈B(C)平均法(AverageLinkage):d=ΣΣd/n,n為全部距離的個數A,Bij(D)中心法(CentroidMethod):2d=d(x,x)=

3、

4、

5、x−x

6、

7、A,BABAB(E)華德法(WardsMethod華德最小變異法):22d=n

8、

9、x−x

10、

11、+n

12、

13、x−x

14、

15、A,BAABB(2)分離分層法(Divisive):開始所有個體為一群,然後分成兩群、三群,直到每個體為一群。此法不常用。2.非分層法最具代表性的為K組平均法(K-Meanns)。開始任意將個體分成K組,然後將個體在個群間移動,使(1)群內變異最小;(2)群間變異最大。3.兩階段法為第一階段分層法分群,決定群組個數,第二階段再以K組平均法進行群集,移動各群組內的個體,保持全部群組為k組。2SPSS點選方式:分層法:Variable(s

16、):放入考慮之群集變數LabelCasesby:放入顯示個體的名稱變數Cluster:Cases(做個體的群集分析);Variables(做變數的群集分析)Display:Statistics(統計量);Plots(圖形)。預設值通常會保留。3Statistics:凝聚過程(Agglomerativeschedule)近似性矩陣(Proximitymatrix)集群組員(ClusterMembership):(設定群集個數)None:沒有設限制Singlesolution:指定一個大於1的數Rangeofsolutions:指定一個範圍4Plots:樹狀

17、圖(Dendrogram)冰柱圖(Icicle):Allclusters(顯示所有群集)Specifiedrangeofclusters(顯示指定的群集範圍之結果)None(不會顯示冰柱圖)方向(Orientation):Vertical(垂直)Horizontal(水平)5Method:凝聚分層法的方法(ClusterMethod)(選取群間距離的算法)(有七種選擇)Measure:(資料型態)(選取點間距離的算法)Interval(區間資料)Counts(計數資料)Binary(二元資料)TransformValues:(轉換值)各種標準化的方式Tr

18、ansformMeasures:(轉換衡量)6Save:集群組員(ClusterMembership):(儲存群集組員變數)None:不儲存Singlesolution:儲存指定一個大於1的數Rangeofsolutions:儲存指定的範圍7K-MEAN:NumberofClusters:自行指定群組個數(內設2)Method:Iterateandclassify(疊代與分群):不斷疊代與更新群中心位置Classifyonly(分群):使用初始設定之群中心位置8910以TOEFL.sav為例,(鄧家駒著,多變量分析)1.凝聚分層法(Agglomerati

19、ve)『群間距離』:華德法『點間距離』:歐氏距離平方(SquaredEuclideanDistance)SPSS程式:CLUSTERgpatoeflgmatworkother/METHODWARD/MEASURE=SEUCLID/PRINTSCHEDULE/PLOTDENDROGRAMVICICLE.ClusterCaseProcessingSummarya,bCasesValidMissingTotalNPercentNPercentNPercent15100.00.015100.0a.SquaredEuclideanDistanceusedb.War

20、dLinkageWardLinkageAgglomerationSchedule

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
相关文章
更多
相关标签