基于模糊聚类(FCM)的学生成绩数据挖掘.pdf

基于模糊聚类(FCM)的学生成绩数据挖掘.pdf

ID:52353219

大小:209.96 KB

页数:3页

时间:2020-03-26

基于模糊聚类(FCM)的学生成绩数据挖掘.pdf_第1页
基于模糊聚类(FCM)的学生成绩数据挖掘.pdf_第2页
基于模糊聚类(FCM)的学生成绩数据挖掘.pdf_第3页
资源描述:

《基于模糊聚类(FCM)的学生成绩数据挖掘.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于模糊聚类(FCM)的学生成绩数据挖掘哈申花张春生(内蒙古民族大学计算机科学与技术学院,内蒙古通辽028000)【摘要】FCM算法是一种基于划分的聚类算法。首先介绍了FCM算法的基本原理,然后针对于学生成绩信息进行模糊聚类分析,通过分析表明FCM方法在学生成绩数据挖掘方面是一个切实有效的好工具。[关键词]模糊聚类;学生;成绩;数据挖掘1.引言FCM算法是一种基于划分的聚类算法,它的思想就是使得被划分到同一簇的对象之间相似度最大,而不问簇之间的相似度最小。模糊C均值算法是普通C均值算法的改进,普通C均值算法对于数据的划分是硬性的,而FCM则是一种柔性的模糊划分。目前,虽然数据挖掘的技术得到了广

2、泛的研究和应用,但在学生成绩数据挖掘方面的研究成果相对较少。本文应用FCM算法,针对我院的学牛成绩应用FCM进行分析,分析结果表明,应用FCM得到的聚类结果是令人满意的,是一个切实有效的数据挖掘工具。2.FCM原理模糊C均值聚类(FcM),即众所周知的模糊ISODATA,是用隶属度确定每个数据点属于某个聚类的程度的一种聚类算法。1973年,Bezdek提出了该算法,是早期硬C均值聚类(HCM)方法的一种改进。FCM把n个向量x;(i_1,2,⋯,n)分为c个模糊组,并求每组的聚类中心,使得非相似性指标的价值函数达到最小。FCM与HCM的主要区别在于FCM用模糊划分,使得每个给定数据点用值在0,

3、l间的隶属度来确定其属于各个组的程度。与引入模糊划分相适应,隶属矩阵u允许有取值在0,1间的元素。不过,加上归一化规定,一个数据集的隶属度的和总等于1:.三’艺%=1,Vj=1,⋯,n(1)i-l那么,FCM的价值函数(或目标函数)就是式(2)的一般化形式:·cCnUJ(u,cl,.”,co=∑Ji=∑∑啪:(2),cl,.”,c0=上=乞乞%氇2(2)i。Ii-lJ这里1lii介于0,1之间;ci为模糊组i的聚类中心,d产忙-酬为第i个聚类中心与第j个数据点间的欧几里德距离;m∈【l,”)是一个加权指数。构造如下新的目标函数:J(U,Cl,⋯,岛,入l,⋯,u1,”=J(u,cl,⋯,cc)

4、+乞xj(乞u日一1)j2l121=∑∑uii晰+∑xj(E喝-I)(3)1。1JJ‘1l。1这里(卜,j=l到n,是n个约束式的拉格朗日乘子。对所有输入参量求导,使式(3)达到最小的必要条件为:∑时xjci2』}一(4)∑妒j2I和由上述两个必要条件可知模糊c均值聚类算法是一个简单的迭代过程。在批处理方式运行时,FCM用I'N步骤确定聚类中心c;和隶属矩阵U:步骤1;用值在0,1间的随机数初始化隶属矩阵U,使其满足式(2)中的约束条件。步骤2:用式(4)计算c个聚类中心Cj,i=l,⋯,c。步骤3:据式(2)计算价值函数。如果它小于某个确定的阈值,或它相对上次价值函数值的改变量小于某个阈值,

5、则算法停If:。步骤4:用(5)计算新的U矩阵。返回步骤2。上述算法也可以先初始化聚类中心,然后再执行迭代过程。由于不能确保FCM收敛于一个最优解。算法的性能依赖于初始聚类中心。因此,我们要么用另外的快速算法确定初始聚类中心,要么每次用不同的初始聚类中心启动该算法,多次运行FCM。3.模糊聚类算法实现下面以本校2003级计算机专业61名学生成绩为例,采用VB编程,进行模糊聚类分析。(1)数据准备建立成绩表,Fcm,,a5),分别代表学生_table(ala2a3a4作者简介:哈申花,女,内蒙古通辽人,本科,讲师.研究方向:数据库技术,软件理论。—-——47·-——的数学成绩,专业课成绩,外语成

6、绩,体育成绩,德育成绩。对学生的综合素质进行聚类,结构如图1所示,对综合素质成绩进行辂理,输入学乍成绩,如图2所示。图1学生成绩表结构图2学生成绩(2)建寺学生成绩聚类程序本稃序采用VB6.0编程,如图3所示。选择分类数,允许用户选择分类数,对学生进行聚类。选择初始中心建立方法,包括随机中心、随机隶属度矩阵、由HCM生成三种方法。选择反模糊方法,用于把模糊分类信息具体化,包括最大隶属度法、中位数法、加权平均法。功能按钮,设置三个命令按钮(FCM方法、HCM方法、退出)用丁.程序控制。成绩显示,设置一个ADO摔件和datagrid控件用于显示和访问FCMtable表。聚类信息町视化,设置t个文本

7、框用于显示“聚类中心”、“隶属度矩阵”、“聚类结果”_}}j丁显示聚类过程。程序信息,设置三个标签控件分别显示“使J

8、J时间”、“迭代次数”和“错误信息”。图3Ft)U设计界面(3)聚类中心采用随机中心点,整个学生分为4类,得到聚类中心。表1聚类中心类聚类中心描述l84.4383.5668.839.4625.70优257.9969.0660.268.9625.03中353.0755.7335.03

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。