西安交大数据挖掘第五次作业

西安交大数据挖掘第五次作业

ID:41705709

大小:74.28 KB

页数:4页

时间:2019-08-30

西安交大数据挖掘第五次作业_第1页
西安交大数据挖掘第五次作业_第2页
西安交大数据挖掘第五次作业_第3页
西安交大数据挖掘第五次作业_第4页
资源描述:

《西安交大数据挖掘第五次作业》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第五次作业WeihuaWang1、假设数据挖掘的任务是将如下八个点聚类为三个类.Al(2,10)A2(2,5)A3(8,4)Bl(5,8)B2(7,5)B3(6,4)Cl(l,2)C2(4,9)距离函数为欧几里得函数.假设初始我们选择A1ZB1,C1为每个聚类的屮心,用K-means方法给出:a)在第一次循环后的三个聚类中心b)最后的三个簇解:首先计算Al(2,10)A2(2,5)A3(8,4)Bl(5,8)B2(7z5)B3(6,4)Cl(l,2)C2(4Z9)Al(2,10)058.493.617.087.218.062.24Bl(5,8)3.614.24503.614.127.211.

2、41Cl(l,2)8.063.167.287.216.715.3607.62由上表可得,各点的归属簇为:A1:A1,B1:A3,B1,B2,B3,C2C1:A2,C1第一次循环后三个聚类屮心为Firstl:(2,10)First2:((8+5+7+6+4)/5,(4+8+5+4+9)/S)=(6,6)First3:((2+l)2(5+2)/2)二(1.535)继续计算各点到簇中心的距离Al(2,10)A2(2,5)A3(8,4)Bl(5,8)B2(7,5)B3(6,4)Cl(lz2)C2(4,9)Fl(2,10)058.493.617.087.218.062.24F2(6,6)5.664.1

3、22.832.241.4126.403.61F3(1.5,3.5)6.521.586.525.705.704.531.586.04市上表可得,各点的归属簇为:F1:A1ZC2F2:A3/B1/B2/B3F3:A2,C1Secondl:((2+4)/2,(10+9)/2)=(3,9.5)Second2:((8+5+7+6)A(4+8+5+4)A)=(6.5/5.25)Second3:((2+l)/2,(5+2)/2)=(1.5,3.5)继续汁算各点到簇中心的距离Al(2,10)A2(2,5)A3(8,4)Bl(5,8)B2(7,5)B3(6,4)Cl(l,2)C2(4,9)Sl(3,9.5)1

4、.124.617.432.506.026.267.761.12S2(6.5,5.25)6.544.511.963.130.561.356.394.51S3(2.5,3.5)6.521.586.525.705.704.531.586.04由上表可知,各点的归属簇为:SI:A1,B1,C2S2:A3,B2,B3S3:A2,C1Thirdl:((2+5+4)/5/(10+8+9)^)=(3.67,9)Third2:((8+7+6)/3/(4+5+4)/3)=(7,4.33)Third3:((2+l)/2,(5+2)/2)=(1.5,3.5)Al(2,10)A2(2,5)A3(&4)B1(5Z8)B

5、2(7,5)B3(6,4)Cl(l,2)C2(4Z9)Tl(3.67,9)1.954.336.611.665.205.527.490.33T2⑺4.33)7.565.041.054.180.671.056.445.55T3(1.5z3.5)6.521.586.525.705.704.531.586.04由上表可知,各点的归属簇为:T1:A1,B1,C2T2:A3,B2,B3T3:A2,C1各点的归属簇至此己不发生变化,故最后的三个簇为:Finall:Al,Bl,C2Final2:A3,B2/B3Final3:A2,Cl2、进行单链和全链层次聚类,绘制树状图显示结果,树状图应当清楚地显示合并的

6、次序。PlP2P3P4P5Pl0.000.100.410.550.35P20.100.000.640.470.98P30.410.640.000.440.85P40.550.470.440.000.76P50.350.980.850.760.00解:单链层次聚类:首先对PlP2聚类{P1,P2}Dmin({pl}/{p2})=0.10再对PlP2P5聚类{P1,P2,P5}Dmin({pl,p2}z{p5})=0.35再对PlP2P5P3聚类{P2,P2,P5,P3}Dmin({pl,p2,p5},{p3})=0.41再对PlP2P5P3P4聚类{P1,P2,P5,P3,P4}Dmin({p

7、l,p2,p5zp3},{p4})=0.44单链层次聚类树状图如下:全链层次聚类首先对PlP2聚类{P1,P2}Dmax({pl},{p2})=0.10再对P3P4聚类{P3,P4}Dmax({p3},{p4})=0.44再对PlP2P3P4聚类Dmax({pl,p2},{p3,p4})=0.64再对PlP2P3P4P5聚类Dmax({pl,p2,p3,p4},{p5})=0.98全链层次聚类树状图如下:

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。