模式识别大作业-k近邻new

模式识别大作业-k近邻new

ID:17380914

大小:77.00 KB

页数:10页

时间:2018-08-30

模式识别大作业-k近邻new_第1页
模式识别大作业-k近邻new_第2页
模式识别大作业-k近邻new_第3页
模式识别大作业-k近邻new_第4页
模式识别大作业-k近邻new_第5页
资源描述:

《模式识别大作业-k近邻new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、姓名:学号:题目对sonar和wdbc中数据(如表1所示)进行分类,并将实验结果填入表中。表1实验数据类别数特征维数样本个数wdbc230=357=212sonar260=98=110解:实验结果准确率Sonar0.5569Wdbc0.8514K-Means聚类算法一.算法思想K-均值算法的主要思想是先在需要分类的数据中寻找K组数据作为初始聚类中心,然后计算其他数据距离这三个聚类中心的距离,将数据归入与其距离最近的聚类中心,之后再对这K个聚类的数据计算均值,作为新的聚类中心,继续以上步骤,直到新的聚类中心与上一次的聚类中心值相等时结束算法。在本次算法实现中

2、,选择在两类样本点中随机选择两个点作为两类数据的初始聚类中心,然后在开始迭代,计算,直至找到最优分类。二.算法流程图开始读入要分类的数据设置初始聚类中心计算数据到K个聚类中心的距离将数据分入与其距离最小的聚类计算新的聚类中心聚类中心是否收敛?否输出K个分好的聚类结束是三.程序运行结果1、对sonar数据进行k均值聚类表一:sonar(Kmeans)运行次数准确率10.591320.603030.504840.581750.490460.519270.673180.572190.5096100.5240平均准确率0.5569程序迭代次数:6得到第一类聚类中心

3、是(0.03250.04430.04690.05850.07170.09830.11620.13060.17420.19900.21790.23890.25620.27370.29650.34580.35680.39370.44860.51300.52660.48250.48940.52340.53120.57450.57900.60560.59510.58030.52200.47910.50200.53870.55080.53270.48230.45410.42710.39140.35470.32250.27240.23810.22080.17990.1

4、2630.09080.05250.02230.01610.01440.01180.01180.01070.00910.00910.00890.00940.0073)得到第二类聚类中心是(0.02640.03360.04130.05010.07810.10970.12630.13830.18110.21590.25100.25960.28740.31550.33970.40550.46470.50070.55110.60430.67710.74110.77690.79570.79430.80320.80370.76690.68080.58140.49000.

5、40600.34730.29160.26210.26300.26610.24530.24220.24500.23530.24180.22520.19430.17780.14470.11930.09190.05140.01890.01600.01260.00980.01020.00810.00750.00680.00720.00670.0058)2、对wdbc数据进行k均值聚类表二:wdbc(Kmeans)运行次数准确率10.851420.851430.8514运行了几次程序,发现准确率一直保持不变,分析可能是由于两类数据比较集中而类间距离又足够大导致,随机

6、选择的样本点对数据分类没有产生什么影响。程序迭代次数:11得到的第一类聚类中心是:1.0e+003*(0.01940.02170.12821.18590.00010.00010.00020.00010.00020.00010.00070.00120.00530.09570.00000.00000.00000.00000.00000.00000.02370.02890.15851.75300.00010.00040.00040.00020.00030.0001)得到的第二类聚类中心是:1.0e+003*(0.01260.01860.08110.49610.0

7、0010.00010.00010.00000.00020.00010.00030.00120.00220.02380.00000.00000.00000.00000.00000.00000.01400.02470.09190.61960.00010.00020.00020.00010.00030.0001)四.实验总结用k均值聚类方法对sonar和wdbc的识别率分别是0.5569和0.8514。主要原因可能是sonar数据中两类数据类间不够分离,类内距离不够紧密,而wdbc数据中两类数据的点类内相对集中,类间足够分离。用k均值聚类对wdbc数据识别率较高

8、。经过几个晚上的艰苦奋斗,努力学习,不断请教前辈大神和上网查询,不

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。