欢迎来到天天文库
浏览记录
ID:52353990
大小:639.54 KB
页数:3页
时间:2020-03-26
《基于聚类技术的网络学习行为数据分析研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、学术探讨·基全劈目基于聚类技术的网络学习行为数据分析研究陈萍(广东青年职业学院计算机工程系,广东广州510507)[摘要]在“互联网+”时代,网络学习已经成为学校教育教学的重要组成部分。文章选取某高职院校《计算机应用基础》网络课程为分析对象,运用聚类技术对高职院校学生在线学习行为进行数据分析,建立学生特征分类模型,为教师优化教学提供决策参考、为学生推送学习建议,以提高网络教学的效果。[关键词]聚类技术;网络学习行为;计算机应用基础;数据分析中图分类号:TP311文献标识码:A文章编号:1008.6609(2017)04.0031.031引言随着移动互联网、云计算、大数据为特征的新一代
2、信息技术的快速发展,学生获取知识的方式也与时俱进,结合在线学习和面授教学的混合式学习方式正在高职院校日益兴起。作为一名高职教师,作者积极参与学院的网络教学资源建设,运用网络信息技术手段进行教学。同时,在教学实践中产生了一些困惑:学生的考试成绩与其在线学习行为、特征是否有关联呢?什么样的学习行为是有效的?教师该如何优化网络课程,为学生提供更具有个性化的教学服务?同时,发现学院的教学管理信息系统、网络自主学习平台积累了大量的教学数据,比如学生的基本信息、登陆数据、闯关学习、测试及学习交流等数据。因此,希望借助聚类技术等数据挖掘方法,对学生在线学习数据进行分析,探索问题的答案。2聚类技术挖
3、掘和K.means聚类算法2.1基本概念数据挖掘(DataMining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又潜在有用的信息和知识的过程n1。近年来,信息化引领着教育模式不断创新,在线学习系统、智能手机应用、社交网络、MOOC课程等提供了大量的数据,教育数据挖掘及分析也成为教育领域的热点。聚类分析是数据挖掘应用的主要技术之一,可作为发现数据分布和模式的独立工具。例如,在保健业,聚类分析腰椎间盘突出患者有哪些不良的生活习惯,可以帮助预防和保健:在证券业,可以聚类分析客户的投资热点板块。聚类分析属于动态分类的方法,分类的数目
4、是未知的,把数据集分为若干不同类别,使同类数据尽可能相似,异类数据尽可能相异。2.2K-means聚类算法聚类分析包含许多算法,其中基于距离的方法最直观,划分聚类算法就是其中的一种,划分聚类算法中最常用的方法是K-means聚类算法,其他许多方法都是在此基础上演变的。聚类算法K-means是一种被广泛应用于科学研究的经典算法,许多统计分析工具软件包都使用它来进行聚类分析。算法的核心思想是通过迭代,把数据集划分为聚类性能最优的不同类别。算法主要步骤如下:(1)在包含m个数据对象的数据集中,任意选P个作为聚类中心的初始点。(2)计算每个数据对象与聚类中心初始点的距离,并把它划分到距离最近
5、的初始点所表示的类别中。(3)重新计算每个有变化聚类的均值。(4)循环执行(2)到(3)直到每个聚类比较稳定,即误差平方和标准函数的值为最优。(5)输出聚类的最终结果。3学生网络学习行为的聚类分析3.1确定挖掘目标近几年,高职院校的《计算机应用基础》课程普遍采用“网络自主学习平台+线下课堂教学”的混合式教学模式,课堂教学的学时大量缩减。作为公共必修课,学院往往要求非作者简介:陈萍(1976一),女,广东湛江人,硕士,讲师,研究方向为数据库应用、计算机教育等。基金项目:广东青年职业学院校级科研项目,项目编号:YB201401。.31.学术探讨·基全页目计算机专业学生要通过计算机I级考证
6、,而学生个体之间存在较大的差异性,因此,要提高考证通过率,教师要引导学生有效地进行网络自主学习。已有研究,网络学习行为与网络学习效果有密切相关12]。因此,通过网络学习平台获取学生的学习行为数据,应用聚类技术,建立学习者特征模型,有利于教师掌握学生的学习特征,从而优化教学策略。3.2数据采集本研究选取某高职院校《计算机应用基础》网络自主学习平台2015级新生的数据作为数据源,保存为excel格式,格式如表1所示;选取由广东省高等学校教学考试管理中心提供的学生期末考证成续表,保存为excel格式,如表2所示。表1自主学习情况表闯关通过学号姓名专业班级次数点数旅游15010210l曹虹1
7、5旅英1494542英语旅游150102102陈宇15旅英l665553英语旅游150102103王冰15旅英15350英语表2考证成绩表考证系别专业班级学号姓名考场成绩外语系旅游英语15旅英1150102101曹虹788.204外语系旅游英语15旅英1150102102陈宇898.204外语系旅游英语15旅英l150102103王冰708.2043.3数据预处理根据原始数据表,采用MicrosoftSQLServer2008建立数据库。数据表包括:(1)
此文档下载收益归作者所有