欢迎来到天天文库
浏览记录
ID:40715869
大小:1.47 MB
页数:71页
时间:2019-08-06
《《数据仓库与数据挖掘》实验指导书》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、《数据仓库与数据挖掘》实验指导书(适用于信息系统与信息管理专业)目录前言1实验一、SPSSClementine软件功能演练5实验二、SPSSClementine数据可视化9实验三、决策树C5.0建模10实验四、关联规则挖掘21实验五、欺诈屏蔽/异常检测/神经网络29实验六、分类和回归树节点(C&RT)40实验七、多项Logistic回归50实验八、综合实验:电力负荷预测56前言一、课程简介数据挖掘(DataMining),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信
2、息库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘,又称为数据库中知识发现(KnowledgeDiscoveryinDatabase,KDD),因此,数据挖掘和数据仓库的协同工作,一方面,可以迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。另一方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。数据挖掘有机结合了来自多学科技术,其中包括:数据库、数理统计、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像与信号处理、空间数据分析等,这里我们强调数据挖掘所处理的是大规模数
3、据,且其挖掘算法应是高效的和可扩展的。通过数据挖掘,可从数据库中挖掘出有意义的知识、规律,或更高层次的信息,并可以从多个角度对其进行浏览察看。所挖掘出的知识可以帮助进行决策支持、过程控制、信息管理、查询处理等等。因此数据挖掘被认为是数据库系统最重要的前沿研究领域之一,也是信息工业中最富有前景的数据库应用领域之一。当前数据挖掘应用主要集中在电信、零售、农业、网络日志、银行、电力、生物、天体、化工、医药等方面。而据Gartner的报告也指出,数据挖掘会成为未来10年内重要的技术之一。69二、课程的任务和实验的教学目标课程编号:5405190课程属性:专业任选课实验学
4、时:12适用专业:信息管理与信息系统先修课程:管理信息系统、计算机基础、数据库技术、统计学《数据仓库与数据挖掘》是一门理论和实践相结合的课程,它在整个信息系统与信息管理专业中处于信息系统应用的前沿应用的地位,是计算机科学的算法理论基础和数据库、数据仓库技术、统计技术的结合,以及在管理实践中应用。其上机实验的目的主要是实现数据挖掘的主要算法,训练学生实际动手进行数据挖掘设计和软件应用的能力,加深对数据挖掘相关概念和算法的理解。本课程具有技术性和实践性较强的特点,因此,配合基本原理的讲授,应当安排相应的实习操作。通过实验和操作,使学生巩固和加深数据仓库与数据挖掘理论
5、知识,进一步加强学生独立分析问题和解决问题的能力、综合设计及创新能力的培养,为今后工作打下良好的基础。经过多层次、多方式的全面训练后,学生应达到下列要求:1.进一步巩固和加深数据仓库与数据挖掘基本知识的理解,提高综合运用所学知识,建立和管理数据的能力。2.能根据需要选学参考书,查阅相关的工具,通过独立思考,深入钻研有关问题,学会自己独立分析问题、解决问题,具有一定的创新能力。3.能正确处理大规模数据,选择数据挖掘工具的开发平台和相关的软件解决实践问题。694.能独立撰写实验报告,准确分析实验结果,总结有关的问题,提出相关的建议。三、实验教材及参考书理论课教材及参
6、考书:F数据仓库与数据挖掘教程(丛书名:高等院校信息管理与信息系统专业系列教材)作者:陈文伟编著,清华大学出版社,2006.8F数据仓库和数据挖掘,苏新宁等编著,清华大学出版社,2006.4F数据仓库与数据挖掘技术(第2版),陈京民编著,电子工业出版社,2007.11FJiaweiHan,MichelineKamber.DataMining:ConceptsandTechniques.高等教育出版社(影印版),2001.5.FIanH.Witten,EibeFrank.DataMining:PracticalMachineLearningToolsandTech
7、niques(第二版).机械工业出版社(影印版),2005.FRichardJ.Roiger,MichaelW.Geatz.DataMining:ATutorial-BasedPrimer.清华大学出版社,2003.实验教材:F数据挖掘Clementine应用实务,谢邦昌主编,机械工业出版社,2008.4F数据挖掘原理与SPSSClementine应用宝典,元昌安主编,电子工业出版社,2009.869四、实验基本内容及学时分配按照《数据仓库与数据挖掘》实验教学大纲的要求,共设立实验8个,总计20学时。试验基本内容与学时分配如下表:序号实验名称实验学时每组人数实验
8、属性实验者类别开出要求1
此文档下载收益归作者所有