资源描述:
《应用多元统计分析实验作业第二次》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、应用多元统计分析实验二姓名杨历班级数学091学号200912010128日期2011.105.8(1)K均值法:ClusterMembershipCaseNumber公司编号ClusterDistance112379.478222422.268332529.018442427.0035521.299E3662403.323772515.5738824.041E3992403.98410102329.550111121.145E312122405.17013131.00014142543.51715
2、152129.556由表可得:15个公司分为两类,第13个公司为一类,其余为另一类。(2)系统聚类法:由spss做出的结果如下图,可以看出若将15个公司为两类:6,9,2,12,4,10,1,7,14,3,15,11,5为一类;8,13为一类。为三类:6,9,2,12,4,10,1,7,14,3,15,11,5为一类;8为一类;13为一类。 两种方法聚类的误差不大。 Rescaled Distance Cluster Combine C A S E 0
3、 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ 6 ─┐ 9 ─┤ 2 ─┤ 12 ─┤ 4 ─┤ 10 ─┤ 1 ─┤ 7 ─┤
4、 14 ─┤ 3 ─┤ 15 ─┼─────────┐ 11 ─┤ ├─────────────────────────────────────┐ 5 ─┘ │ │ 8 ───────────┘ │
5、 13 ─────────────────────────────────────────────────┘5.9(1)系统聚类: 河北 3 ─┐ 河南 16 ─┼─┐ 山西 4 ─┘ ├─┐ 山东 15 ───┘ │ 天津 2 ─┐ ├─────────┐ 江苏 10 ─┼─┐ │ │ 辽宁 6 ─┘ │ │ │ 福建 13
6、─┐ ├─┘ │ 江西 14 ─┤ │ ├─────────────────────────────────┐ 安徽 12 ─┼─┤ │ │ 内蒙古 5 ─┤ │ │ │ 黑龙江 8 ─┘ │ │
7、 │ 吉林 7 ───┘ │ │ 北京 1 ───┬───────────┘ │ 浙江 11 ───┘ │ 上海 9 ──────────────────────────
8、───────────────────────┘由图可得,若将16个地区分为两类:上海为一类;其余为另一类。三类:上海为一类;北京,浙江为一类;其余为一类。ClusterMembershipCaseNumber地区ClusterDistance1北京146.7442天津122.9173河北322.4804山西316.8645内蒙古313.8806辽宁115.2347吉林126.2728黑龙江37.5139上海2.00010江苏114.59111浙江117.98412安徽319.50