资源描述:
《模糊聚类分析在学生成绩中的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、模糊聚类分析在学生成绩中的应用姓名:罗慧玲学号:1041220108专业:信息与计算科学模糊聚类分析在学生成绩中的应用摘要:本文首先给出了聚类的定义及其算法分类,然后详细介绍了模糊聚类分析的一般步骤。z后再给出学牛成绩的一些数据,通过标准化运算,写出矩阵并求传递闭包,最后求出模糊聚类矩阵进行运算分类,最后得出结论。关键词:模糊数学聚类分析等价矩阵学生成绩1聚类的定义及算法的分类“人以祥分,物以类聚。”聚类是一种重要的人类行为,通过适当聚类,事物才便于研究,事物的内部规律才可能为人类所掌握。聚类是指按照事物的某些属性,把事物聚集成类,使类间的相似性尽量小,类内的相似性尽量大,按照相似程度的大小
2、,将事物逐一归类。目前聚类算法主耍课分为三大类:(1)层次聚类算法(树聚类算法):它使川数据的连接规则,透过一种层次构架方式,反复讲数据进行分裂和聚合,以形成一个层次序列的聚类问题解。(2)划分式聚类算法:它需预先指定聚类数1=1或聚类小心,通过反复迭代运算,逐步降低bl标函数的误差值。当kl标函数值收敛时,得到最终聚类结果,如k均值聚类算法(或称C均值聚类算法)、F聚类算法和图论聚类算法。(3)基于网络和密度的聚类算法:基于密度的聚类算法是通过数据密度來发现任意形状的类簇,而基丁-网格的聚类算法常常与其他方法(如基于密度聚类算法)相结合來发现任意形状的类簇。它们在以空间信息处理为代表的众多
3、领域有着广泛应用,特別适合于大规模数据集的分类。2基于F等价矩阵模糊聚类分析的一般步骤2.1数据标准化(1)数据矩阵设论域=为被分类对象,每个对象又山m个指标表示其特征:旺二{心,心,…,心},心1,2,.../.于是,得到原始数据矩阵X为:(2)数据标准化根据F矩阵的要求,一般将数据压缩到区间[0,1J±,可釆用下面的方法实现:①平移一标准差变换X・—X・x'j:=lJ,7(/=12SJ)=12・・・冲)其中,经过变换后,每个变暈的均值为0,标准差为1,消除了不同量纲的影响,但处理后的数据不一定在[0,1]上。②平移一极差变换心=心―n讪叩1GS}IJmax{x/y\
4、x/y11max(Vxf'Ja'②相关系数法£lx,-xjlx.-x.l"1乞凤-和冷工g-兀)k=lV*=11m其中,耳=—ma-=i③最大最小法m工min(q)k=l工maxg,f)k=l④算术平均最小法工min(%,r)r=v]f、上
5、(%+r)zR=1⑤儿何平均最小法m工min(七,兀八)k=②绝対值指数法rn③绝对值减数法_Iw当i=j"i-c£i%-◎i当心jia其中,c适当选取,使OS©<1.在上述7种方法中,要根据实际情况选择最好的一•种方法。在实际的应用中,选取多种方法选取的分类最符合实际结杲。2.3改造相似关系为等价关系由第二步得到的矩阵Ri般只满足自反性和对称性,即R是相似矩阵,需将它改造成F等价矩阵。因此,采用平方法求岀R的传递闭包斤斤便是所求的F等价矩阵。2.4聚类并画动态聚类图对等价矩阵斤,选取适当的阈值Ag[0,1],按2截关系进行动态聚类。3用模糊聚类分析对学生成绩进行评价表3-1是抽取某学校某
6、专业10名学生的期末成绩,如下:表3-1序号大学英语体育建筑材料土木工程概论18893918328877787438680837548582768059585858968482898479081877787882807997383877210627587873.1选择统计指标设10名同学组成一个分类集合:X={州,兀2,•••,£},分别代表序号1T0这儿名同学。每门课程成绩采用的是都学习的两门基础课大学英语、体冇和两门专业课建筑材料、土木工程概论作为四项统计指标,即有:勺={心,兀力心,®}。这里勺表示为第i个同学的第j门课程指标(z=l,2,...,10,j=1,2,3,4)。这四项成绩
7、指标为:大学英语(冷),体育(乜),建筑材料(旺3),土木工程概论(心4)3.2数据标准化木文采川的方法是极差变换:(321)X,七—min{^丨15,5川ijmax{x/;.11