资源描述:
《数据仓库与数据挖掘_课程教学实践与探索new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、高教论坛2011年1月第1期Jan2011No1HigherEducationForum数据仓库与数据挖掘课程教学实践与探索韦艳艳,张超群(广西民族大学数学与计算机科学学院,广西南宁530006)摘要:本文从数据仓库与数据挖掘课程的本科教学特点出发,讨论了在授课过程中遇到的一些实际问题,介绍了理论教学环节和实验教学环节的各项内容及侧重点,并给出具体的实验教学方案。关键词:教学实践;数据仓库;数据挖掘中图分类号:G642文献标识码:A文章编号:1671-9719(2
2、011)01-0094-03作者简介:韦艳艳(1974-),女,广西贵港人,讲师,主要研究方向为数据挖掘、机器学习。收稿日期:2010-10-11使学生对数据仓库与数据挖掘的整体结构、概念和一、前言技术有深入的认识和了解,并且熟悉相关算法的基数据仓库与数据挖掘技术出现于20世纪80年本原理,提高学生分析数据的思维能力与计算能力。代,90年代有了突飞猛进的发展。这是信息和数据教材方面,我们采用的是清华大学出版社出版,深度处理的必然需要,也是体现信息价值的重要工由安淑芝等编著数据仓库与数据挖掘,同时还
3、向具。现在,数据仓库与数据挖掘作为一门既有理学生推荐阅读韩家炜编著的数据挖掘:概念与技论基础又有实际应用价值的学科,已经成为计算机、术,这是一本得到业内广泛认可的的经典教科[3]信息系统等很多专业本科生的学习内容之一,由此书。该课程理论课时共22学时,各章节授课学时安可见这门学科在当今科学中的重要性以及应用的广排如表1所示。泛性。表1各章节的授课学时本课程是计算机科学与技术本科生在第三学年开设的选修课程。作为一门前沿性学科,数据仓库章节学时与数据挖掘有许多技术和方法是开放式、或仍处于第一章绪论
4、2探索阶段的。因此,学生除了掌握基本的概念与方第二章数据仓库7法之外,对该门学科中许多面临的问题、有待拓展的第三章数据预处理3研究方向应有所了解,这样有助于为学生提供对该第四章数据挖掘的基础知识2学科的一个广博且适度的概览,提高自主学习的能力,并为有志于在该领域进行深入研究的学生提供第五章数据挖掘的常用算法8一个学习的机会。由于该课程原本属于研究生阶段开设的专业课表2实验教学内容程,教材也大多侧重于介绍体系结构、算法原理、效实验内容课时率分析与改进等理论知识,其中所涉及的内容大多数据仓库的基本构
5、造方法及实施联机分析比较深,许多知识都超出了本科生的接受范围;此4处理外,教材对相关理论在实际应用方面的说明也比较构建Northwind数据仓库系统4少,不利于安排实验教学。因此,要实现数据仓库数据收集及预处理2与数据挖掘课程的教学目标,必须在理论教学和实验教学环节综合考虑学时多少、教学条件以及学生各类数据挖掘及分析8[1-2]的接受情况等因素,灵活地加以选择安排。实验课时共18学时,实验内容主要配合教学环二、课程的教学内容节来设置。具体安排如表2所示。本课程的任务主要是从数据库角度出发,全面、
6、三、理论教学环节系统地介绍数据仓库与数据挖掘的基本概念、基本方法以及该领域的最新进展。通过本课程的学习,数据仓库与数据挖掘这门课程所涉及的是多94个学科的交叉领域,要求学生有扎实的计算机专业挖掘,根据实验室的硬件条件及教材提供的实验内知识,且应当掌握如数据库系统、程序设计、概率统容,我们选择微软的SQLServer2000(含Analysis计、数据结构、机器学习等学科的基础知识。但由于Service组件以及SPSS的Climentine80作为实验本科生课程在教学设置及课时安排方面的原因,学软件
7、。生不可能完全了解相关的学科内容,因此,本课程在(二)实验项目设置理论讲解时,对涉及到学生比较生疏的知识点,比如1.使用数据仓库开发工具决策支持对数据的特殊要求、知识的定义及表示方SQLServer2000提供了一套完全的数据库和法、信息熵的计算等等,应根据学生已有的知识水数据分析解决方案,其中的AnalysisService组件支平,结合实例予以说明。持数据仓库的创建和应用,并提供了多功能强大的数据仓库与数据挖掘这门课程与数据库有着工具和服务以帮助完成数据仓库的建立、维护,进行紧密的联系,在讲解数据
8、仓库部分时,应当首先让学OLAP联机分析和数据挖掘。AnalysisService自生了解数据管理技术从数据库发展到数据仓库的过带有一个实例教程,非常适合初学者使用。程,以便理解数据仓库技术和数据挖掘技术产生的由于学生从未使用过SQLServer的Analysis原因,进而出现数据挖掘这一类深层次的数据分析Service,也不了解这一组件,所以首先让学生熟悉这的发展过程。而在讲解数据仓库与数据挖掘的关系个软件,具体做法是根据实