欢迎来到天天文库
浏览记录
ID:6787783
大小:831.00 KB
页数:16页
时间:2018-01-25
《基于系统聚类法对中学教育进行研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于系统聚类法对中学教育进行研究摘要目前全国中学已经系统地设置了语文、数学、历史等各个课程,学生的学习视野日益扩大。但是,由于各个课程的特点不一,现今的科技技术、知识信息也在不断的变更,一成不变的教学方法与目前学生的性心理和生理发育格格不入,而因人而异、不断改善的教育教学比较符合当前中学学生的认知水平,能较好地提高课堂教学效果,缩短与教学目的之间的距离,因此不断的探索各个课程的教育形式和内容尤为重要。学生管理是学校教育的重要组成部分,清晰认识学生自身特点是对学生实施有针对性管理的前提。本文在掌握了系统聚类法的理论的基础之上,运用系统聚类的方法,以一实验中学七年级
2、的学生在中期考试、期末考试中的成绩为代表,计算不同的样本距离以及不同的类间距,分析各科成绩的状况以及课程之间的联系,找到适合学生成绩分类的最佳组合,对以后老师的教学管理起一定的参考作用。关键词:中学教育系统聚类法样品间距类间距学生成绩一、背景分析本文列出一实验学校各个年级的学生在中期考试、期末考试中的成绩表,s1-s4依次表示7年级阶段各次半期和期末考试的成绩;e1-e4依次表示8年级阶段各次半期和期末考试的成绩;n1依次表示9年级阶段第一次月考的成绩。数据保存在文件st-grades.xls中,数据格式如表所列。为了方便班主任的管理和各个任课老师教学的方便,需
3、要对该班学生的成绩进行分类,再将各个类别人员的变动情况进行比较,方便老师了解该同学的学习的动态状况,以便老师结合其实际情况对其指导教学,促进学生的学习,为学生中考做好准备。根据资料自主选择时间,变量,样本进行多元统计分析。本文将根据这4个主要变量的观测数据,6种不同方法,利用系统聚类法,以七年级学生的成绩为代表,进行聚类分析。二、聚类分析简介2.1系统聚类法的基本原理先假定各个样品各自成一类,这时各类间的距离就是各样品之间的距离,将距离最近的两类合并成一个新的类;再计算新类与其它类间的距离,将距离最近的两类合并,如此每次缩小一类,直至所有的样品都成为一类为止。然
4、后根据需要或者根据给出的距离临界值(阈值)确定分类数及最终要分的类。设有n个样品,每个样品测得p项指标(变量),原始资料阵为其中为第i个样品的第j个指标的观测数据。第i个样品Xi为矩阵X的第i行所描述,所以任何两个样品XK与XL之间的相似性,可以通过矩阵X中的第K行与第L行的相似程度来刻划;任何两个变量与之间的相似性,可以通过第K列与第L列的相似程度来刻划。如果把n个样品(X中的n个行)看成p维空间中n个点,则两个样品间相似程度可用p维空间中两点的距离来度量。2.2距离2.2.1常用的距离假设有两个p维样本,(1)欧氏距离(2)标准化欧氏距离这里D表示n个样本的
5、方差矩阵,表示第j列的方差。(3)布洛克距离(绝对距离)(4)闵可夫斯基(Minkowski)距离注:当q=1时是布洛克距离(绝对距离);当q=2时是欧氏距离。当各变量的测量值相差悬殊时,要用明氏距离并不合理,常需要先对数据标准化,然后用标准化后的数据计算距离。为弥补闵可夫斯基(Minkowski)距离的不足之处,平衡各个指标对欧氏距离的贡献,提高结果的正确率。因此一个合理的做法,就是对坐标加权,这就产生了“统计距离”。比如设,,且Q的坐标是固定的,点P的坐标相互独立地变化。用s11,s12,…,spp表示p个变量的n次观测的样本方差,则可以定义P到Q的统计距离
6、为:所加的权是,即用样本方差除相应坐标。当取时,就是点P到原点O的距离。若时,就是欧氏距离。(5)马氏(Mahalanobis)距离马氏距离是由印度统计学家马哈拉诺比斯于1936年引入的,故称为马氏距离。这一距离在多元统计分析中起着十分重要的作用。假设共有p个指标,第i个指标共测得m个数据(要求m>n),于是,得到阶的数据矩阵,每一行是一个样本数据。阶的数据矩阵的阶协方差矩阵记作,其中,如果存在,则两个样品之间的马氏距离为马氏距离既排除了各指标之间相关性的干扰,而且还不受各指标量纲的影响。除此之外,它还有一些优点,如可以证明,将原数据作一线性交换后,马氏距离仍不
7、变等等。(6)相似距离(Correlationdistance)2.3六种系统聚类法正如样品之间的距离可以有不同的定义方法一样,类与类之间的距离也有各种定义。例如可以定义类与类之间的距离为两类之间最近样品的距离,或者定义为两类之间最远样品的距离,也可以定义为两类重心之间的距离等等。类与类之间用不同的方法定义距离,就产生了不同的系统聚类方法。本节介绍常用的八种系统聚类方法,即最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、离差平方和法。系统聚类分析尽管方法很多,但归类的步骤基本上是一样的,所不同的仅是类与类之间的距离有不同的定义方法,从
8、而得到不同的计算距离的公
此文档下载收益归作者所有