欢迎来到天天文库
浏览记录
ID:31360264
大小:108.50 KB
页数:7页
时间:2019-01-09
《基于数据挖掘的网络学习行为研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于数据挖掘的网络学习行为研究 【摘要】随着信息技术的发展,网络学习已成为一种主要的学习途径,本文探讨了通过Web对网络学习行为进行数据采集,收集学习者的特征。并利用数据挖掘工具Weka进行数据分析网络学习与学习者之间的关系。 【关键词】网络学习行为;Web数据挖掘;Weka 1研究背景 在以信息技术为代表的科学技术飞速发展的当下,网络已经成为一种重要的学习途径,而网络学习也成为越来越多学习者的一种学习习惯。据统计,截至2014年6月,我国网民规模达6.32亿,互联网普及率为46.9%。另据艾瑞咨询数据显示,2014在线教育市场规模将达998亿,增长率达19%,未来
2、学历教育、职业在线教育将是市场规模高速增长的主要动力。教育部关于教育信息化十年发展规划(2011-2020年)也提到,虽然面向全国的教学信息基础设施体系初步形成,数字教育资源不断丰富,信息化教学的应用不断拓展和深入;教育管理信息化初见成效。但与学习者的需求和世界发达国家水平相比还有明显差距。到2020年,目标全面完成《教育规划纲要》所提出的教育信息化任务,基本建成人人可享有优质教育资源的信息化学习环境,信息技术与教育融合发展的水平显著提升,信息化环境下学生自主学习能力明显增强,教学方式与教育模式创新不断深入,信息化对教育变革的促进作用充分显现。7 2研究意义 伴随互联网
3、技术的发展和人们对网络学习认知的改变,网络教学平台也迅速从点播式教学平台、交互式教学平台向社会化教学平台转变,即学习者可以通过智能化的搜索引擎、Blog、以及社交软件等,最大范围的搜索学习资源,建立符合自己个性的学习网络。对于广大的一线教师来说,一方面可以利用的教学资源异常丰富,能够利用网络将教学场所延伸到课堂之外。另一方面,学生仍存在着学习效率偏低,学习动机偏弱,师生及生生交互不充分,学习资源及工具利用率低下等突出问题。这将直接导致学习效果不理想,也不利于教师把握教学过程,进而给网络教学的效果带来极大的困难与挑战。 数据挖掘是从大量的、不完全的、模糊的、随机的数据中提取
4、潜在的有用信息和知识的过程,目前,数据挖掘技术已经广泛的被应用于银行、电信、保险、交通、零售(如超级市场)等商业领域,但在教育领域的应用还较少。本文研究的是数据挖掘在Web上的应用,通过记录学习者访问数据;如参考页面、访问时间和日期、用户站点等信息获得出学习行为的特征信息。研究学生网络学习的行为问题为构建个性化、智能化的学习系统提供有益的支持,总结其一般规律,并将其应用于教学平台及教学资源开发、教学评价、教学管理与支持服务,将能更有效地发挥网络学习的优势,提高教学效率和成效。 3Web数据挖掘的相关概念 3.1Web挖掘的定义和分类7 万维网是全球最大的信息服务中心,
5、其包含丰富的动态超链接信息和Web页面的访问使用信息。这些数据具有复杂性高、动态性强、半结构化等特点。Web挖掘是数据挖掘在Web技术中的应用,就是利用数据挖掘技术在因特网文件及服务中发现并提取隐含的信息。 Web数据挖掘可以分为Web内容挖掘、Web结构挖掘和Web日志挖掘三类。Web内容挖掘是从Web页面中抽取有用信息的过程。即从图片、文本、视频等网页中众多非结构化的数据中找出类似的信息。其重点是页面的分类和聚类;Web结构挖掘是从Web组织结构和链接关系中推导知识。页面链接信息是Web数据的一个重要的方面,发掘网页之间的链接信息,可以用来指导对页面进行分类和聚类,帮
6、助用户找到权威页面、中心页面,从而提高检索的性能Web结构挖掘可以分为Web文档内部结构挖掘和文档间的超链接结构挖掘;Web日志挖掘也称为Web使用挖掘,是从服务器端记录的用户访问日志或从用户的浏览信息中抽取感兴趣的模式,通过分析这些数据可以帮助理解用户隐藏在数据中的行为模式,做出预测性分析,从而改进站点的结构或为用户提供个性化的服务。 3.2Web日志挖掘的过程 Web服务器在收到用户请求并响应时,会将相关的信息写入日志文件,这些数据便是Web挖掘的原始数据,网站日志文件包含的数据信息有:使用者的IP地址、日期、需求的资源、资源存取的状态等。Web日志挖掘的过程如图1
7、所示: 1)数据预处理:获取Web日志数据,并将其转换为适合数据挖掘的形式;7 2)模式发掘:利用数据挖掘工具及适当的算法对数据进行挖掘并生成模式; 3)模式分析:对发掘生成的模式进行转换,从中提取对用户有用的信息。 4网络学习行为数据的采集 Web日志挖掘通过对网络学习平台学习者交互信息的数据库进行分析并发现学习者的学习行为特征。Web日志可以记录使用者的一切操作,如通过记录学习者频繁登录的页面,页面驻留的时间,可以发掘最受欢迎的教学资源,并将其推荐给其他可能的学习者。通过记录学习者的发帖数、提交作业等
此文档下载收益归作者所有