欢迎来到天天文库
浏览记录
ID:17932469
大小:331.50 KB
页数:19页
时间:2018-09-10
《08数据万挖掘——课程设计报告模板》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、河南科技大学课程设计说明书课程名称__软件项目综合实践__题目______________院系_国际教育学院_班级_____计科082_____学生姓名______刘焕文_____指导教师_孙士保、白秀玲、赵海霞、杨春蕾_日期_2011.8.29~2011.9.9_软件项目综合实践任务书软件项目综合实践题目【超市商品销售/图书借阅/学生成绩】数据挖掘系统姓名学号专业班级组长同组成员指导教师孙士保白秀玲赵海霞杨春蕾软件综合实践目的通过综合实践,使学生巩固数据库技术、数据结构、数据挖掘等知识,将理论与实际相结合,完成一个小型数据挖掘系统的设计与实现。在此基础上强化学生的实践意识,提高其实际动手能力
2、和创新能力。软件综合实践环境硬件:装有windows操作系统的计算机软件:SQLServer2000及【填写自己采用的开发工具】。软件综合实践任务和要求任务:1.进行【超市商品销售/图书借阅/学生成绩】数据挖掘系统的数据管理、数据采集、数据预处理、数据挖掘、解释评估等步骤的设计;2.实现【超市商品销售/图书借阅/学生成绩】数据挖掘系统的【xx,填写自己实现的功能名称】功能。要求:1.功能满足需求说明、界面友好、保证一定性能要求。2.撰写出符合要求的软件项目综合实践报告。参考文献[学生自己填写,按报告要求的格式]时间进度安排序号起止日期工作内容12011年8月29日讲授数据挖掘概念及其算法,学生
3、分组22011年8月30日数据预处理,根据给定的数据库的数据形成挖掘处理所需要的数据格式32011年8月31日----9月5日算法设计42011年9月6日界面设计:参数设置,阈值设定;结果显示52011年9月7日程序组装调试62011年9月8日形成文档内容及格式撰写要求,讲授文档撰写方法,撰写软件综合实践报告72011年9月9日上交软件综合实践报告附:超市商品销售数据挖掘系统需求说明一、关联规则算法要求挖掘出超市商品销售之间的关联,如哪些商品往往会一起购买。1.数据管理。对数据库中的数据进行管理和维护工作。2.数据采集。从数据库中采集数据,形成事务集合。要求至少要有100条事务。如:事务1:牙
4、膏、牙刷、牛奶、饼干事务2:牛奶,面包,手套即顾客一次购买的商品名称。3.数据预处理。将采集到的数据转换为可进行数据挖掘的形式。如事务:牙膏、牙刷、牛奶、饼干。可转换为:1,2,3,44.数据挖掘。采用关联规则中的Apriori算法对超市销售事务集合进行数据挖掘。挖掘出的结果形如:牛奶==>面包支持度2%,置信度30%,或牛奶、面包==>牙刷支持度0.5%,置信度1%5.结果显示与解释评估。把挖掘出的结果以一种直观的方式显示出来,并对挖掘出的结果进行评价。如上述第一例,可解释为:包含牛奶和面包的交易数与总交易数之比为2%,包含牛奶和面包的交易数与包含牛奶的交易数之比为30%。二、决策树方法要求
5、挖掘出各类商品的销售额和利润之间的关联。1.数据采集。从数据库中采集数据,形成事务集合。要求至少要有100条事务。数据集形式序号食品类(销售额)洗化类(销售额)服装类(销售额)书籍类(销售额)家电类(销售额)利润(销售额)113696545621264569高25644586932891687中3296126565432126低…其中每条数据为一天的销售情况,利润为决策属性,其余为条件属性,数字表示该类商品的销售额。2.数据预处理。将采集到的数据转换为可进行数据挖掘的形式。如:销售额<100可转换为1,100<销售额<1000可转换为2…利润高可转换为1,中可转换为2,低可转换为33.数据挖掘
6、。采用决策树对商品销售集合进行数据挖掘,形成决策树,并形成分类。决策树略。分类规则形如:家电类>5000,100<洗化类<1000==>利润高4.结果显示与解释评估。把挖掘出的结果以一种直观的方式显示出来,并对挖掘出的结果进行评价。报告上不要写上附:学生成绩数据挖掘系统需求说明一、关联规则算法要求挖掘出学生各门功课成绩间的关联,如什么课程成绩好会导致另外课程成绩较好。1.数据管理。对数据库中的数据进行管理和维护工作。2.数据采集。从数据库中采集数据,形成事务集合。事务集数据形式。其中每项的数字为该门课程的考试成绩。序号离散数学数据结构操作系统计算机网络组成原理面向对象程序设计184749084
7、75652736381765274…3.数据预处理。将采集到的数据转换为可进行数据挖掘的形式。首先将连续数据转化为离散数据,如:优、良、中、及格、不及格。接着再进行转化,如事务:离散数学优、数据结构良、操作系统及、计算机网络中、组成原理优、面向对象程序设计中。可转换为:1,3,6,7,2,84.数据挖掘。采用关联规则中的Apriori算法对学生成绩集合进行数据挖掘。挖掘出的结果形如:组成原理优==
此文档下载收益归作者所有