模式识别大作业-k近邻

模式识别大作业-k近邻

ID:41688784

大小:58.88 KB

页数:10页

时间:2019-08-30

模式识别大作业-k近邻_第1页
模式识别大作业-k近邻_第2页
模式识别大作业-k近邻_第3页
模式识别大作业-k近邻_第4页
模式识别大作业-k近邻_第5页
资源描述:

《模式识别大作业-k近邻》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、姓名:学号:题目对sonar和wdbc屮数据(如表1所示)进行分类,并将实验结果填入表屮。表1实验数据类别数特征维数样本个数wdbc230叫=357w2=212sonar260w{=98vv2=110ZL77实验结果准确率Sonar0.5569Wdbc0.8514K-Means聚类算法算法思想K-均值算法的主要思想是先在需要分类的数据中寻找K组数据作为初始聚类屮心,然后计算其他数据距离这三个聚类屮心的距离,将数据归入与其距离最近的聚类中心,之后再对这K个聚类的数据计算均值,作为新的聚类中心,继续以上步骤,直到新的聚类屮心与上一次的聚类屮心值相等时结束算法。在木次算法实现

2、中,选择在两类样本点中随机选择两个点作为两类数据的初始聚类中心,然后在开始迭代,计算,直至找到最优分类。二.算法流程图三•程序运行结果1、对sonar数据进行k均值聚类表一:sonar(Kmeans)运行次数准确率10.591320.603030.504840.581750.490460.519270.673180.572190.5096100.5240平均准确率0.5569程序迭代次数:6得到第一类聚类中心是(0.03250.04430.04690.05850.07170.09830.11620.13060.17420.19900.21790.23890.25620.

3、27370.29650.34580.35680.39370.44860.51300.52660.48250.48940.52340.53120.57450.57900.60560.59510.58030.52200.47910.50200.53870.55080.53270.48230.45410.42710.39140.35470.32250.27240.23810.22080.17990.12630.09080.05250.02230.01610.01440.01180.01180.01070.00910.00910.00890.00940.0073)得到第二类聚类

4、屮心是(0.02640.03360.04130.05010.07810.10970.12630.13830.18110.21590.25100.25960.28740.31550.33970.40550.46470.50070.55110.60430.67710.74110.77690.79570.79430.80320.80370.76690.68080.58140.49000.40600.34730.29160.26210.26300.26610.24530.24220.24500.23530.24180.22520.19430.17780.14470.11930.

5、09190.05140.01890.01600.01260.00680.00720.00670.00980.0058)0.01020.00810.00752、对wdbc数据进行k均值聚类表二:wdbc(Kmeans)运行次数准确率10.851420.851430.8514运行了几次程序,发现准确率一直保持不变,分析可能是由于两类数据比较集屮而类间距离又足够大导致,随机选择的样本点对数据分类没有产生什么影响。程序迭代次数:11得到的第一类聚类中心是:1.0e+003*(0.01940.00010.00000.02890.00030.02170.00020.00000.15

6、850.0001)0.12820.00010.00001.75301.18590.00070.00000.00010.00010.00120.00000.00040.00010.00530.00000.00040.00020.09570.02370.0002得到的第二类聚类中心是:1.0e+003*(0.01260.00000.00000.02470.00030.01860.00020.00000.09190.0001)0.08110.00010.00000.61960.49610.00030.00000.00010.00010.00120.00000.00020.00

7、010.00220.00000.00020.00010.02380.01400.0001四•实验总结用k均值聚类方法对sonar和wdbc的识别率分别是0.5569和0.8514。主耍原因可能是sonar数据中两类数据类间不够分离,类内距离不够紧密,而wdbc数据屮两类数据的点类内相对集屮,类间足够分离。用k均值聚类对wdbc数据识别率较高。经过几个晩上的艰苦奋斗,努力学习,不断请教前辈大神和上网查询,不断调试程序,最终才得以成功运行,我对这几种判别方法有了更深层次的认识,同时对matlab这个强大的数值计算软件应用的也更加熟练,山重水复

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。