欢迎来到天天文库
浏览记录
ID:41707309
大小:80.94 KB
页数:6页
时间:2019-08-30
《数据挖掘在教师调串课中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、数据挖掘在调串课中的应用研究摘要:针对我校近三年来的调串课情况,应用数据挖掘技术,对海量的教师调串课数据进行分析整理,得出了教师调串课的i般规律,将规律应用在课程编排过程中,解决了资源浪费等问题,取得了良好的效果。关键词:调串课、数据挖掘、决策树、增益率。TheapplicationofdataminingfortransferlessonsZhanglei(TheacademicadministrationofJiamusiUnivcrsityHeiLongjiangprovince)Abstract:Inconnectionwi
2、ththesituationoftransferlessonsfornearlythreeyears,usethedatamining,analysisthemananimitydataofteacherswhichtransferlessons,obtainthelawsofteachertransferlessons.usethoselawsincoursearrangingresolvetheproblemsofresourcewasteandgoodeffectivenessisgained.引言日常教学中经常会有教师因为各
3、种各样的问题要求进行调串课,这样不仅打破了止常的教学规律,给日常的课程安排和教学检查带来麻烦,而且造成了很大的人力、教室资源等方面的浪费。如何在教师的基本数据屮提取出有用的信息和知识,对潜在的调串课现象进行预处理,减少调串课对正常教学的影响,成为各高校教学管理中亟待解决的问题。但是由于各学校调串课的数据量巨大,仅以我校为例,2009年9月就多达上百份,使用简单的统计学方法无法满足需求,因此,综合本校的具体情况,应用数据挖掘技术中的决策树算法,解决本校调串课所带来的不良影响。由于调串课是比较典型的分类问题,并且某些训练样本可能缺少属性
4、,所以本文使用C4.5决策树模型。-、数据清理教师的调串课基本情况包括如:姓名、性别、年龄、学历等,具体数据情况见表1。(教师姓名为虚构,数据以2008年春季学期部分数据为例。)编号7院姓名性别年龄学历职务是否调串课08090701咅乐学院—1—咼兄女30本科调课08090702材料学院繁荣女53硕士教研室主任调课08090703人文学院王民女45木科院长调课08090802材料学院杨斌出40硕士教研宗主任调课08090804教育科学学院许美女40硕士院长调课外国语学院孟秀女33本科未调课08091102药学院于丽女45硕士副院长调
5、课08071403教育科学学院闫华男29本科调课理学院咸淳男45木科副院长未调课08091406材料学院李博男28本科调课08091701基础医学院刘波男50本科调课信息学院王梅女40硕士未调课08092403牛命科学学院董文男41博士教研宗主任调课机械学院杨华女26木科未调课国际学院王元男39硕士未调课(表1)市于表中样本存在缺少属性的现象,所以针对不同属性的缺失采用不同的方法进行预处理。如:缺失姓名的样本将直接抛弃,缺失年龄的采用箱平均值平滑法进行处理,缺失学历的直接填充为本科。将无课教师筛选出去计算中不作考虑。二、计算增益率选
6、取属性在决策树建立过程的选择点上,增益率最大的属性是用来进一步细分树结构而选取的属性。属性的增益率计算公式[1]:GainRatio(A)=Gain(A)/SplitInfo(A)Gain的计算公式:Gain(A)=Info(I)・Info(I,A)甘由Tr总#inclassi,#inclassixKT:Info(I)=-〉log()台#加/#ini将I划分为k个结果后Info(I,A)乞帥山冏血fogassj);=i#inlSME(A)=-才需%畀;;驚)将(表1)中的除编号外的各个属性分别代入到公式中,其中#inl取为在选定属性
7、下是否调串课的数据总个数,#inclassi(#inclassj)所取的值为调课的数据个数。通过计算机自动计算出每个属性大的增益率。三、构建决策树计算取得增益率之后,根据所得的增益率最高选取该属性作为选定节点构建决策树。构建决策树的算法为⑵:Decision_tree(samples,attr_candidate)将属性设为决策树的点并计为C;ifsamples都在同一类then返回C作为叶节点并计为leaf;ifattr为空then返回C作为叶节点;根据相应策略选择属性attr_candidate;依次测试该选定属性的测试值坷:在
8、符合条件的测试值节点上长出一个条件为test=«,的分支;设®为samples中test=a.的样本集合;ifq•为空then加上一个叶子;else通过Decision_tree(»,test)进行构造。其中,C作为表1中具体属性在程
此文档下载收益归作者所有