2012数据仓库课设

2012数据仓库课设

ID:35928895

大小:174.50 KB

页数:13页

时间:2019-04-25

2012数据仓库课设_第1页
2012数据仓库课设_第2页
2012数据仓库课设_第3页
2012数据仓库课设_第4页
2012数据仓库课设_第5页
资源描述:

《2012数据仓库课设》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、《数据仓库与数据挖掘》课程设计报告班级:信管101学号:3100561021姓名:黄彦芳指导教师:王建仁/段刚龙日期:2012.01.041需求分析与数据理解21.1需求分析2121.2数据理解22挖掘(或分析)数据准备23数据挖掘(或分析)过程73.1挖掘算法与挖掘软件选择73.2数据预处理73.3挖掘过程说明84结果展示与评价95总结95.1设计中遇到的主要问题及解决方法105.2设计方案的主要优点及不足105.3收获及建议10参考文献11题目1需求分析与数据理解121.1需求分析即明确挖掘目标和要求。(1)方法:在本次实验中我们采用了头脑风暴方法进行问题分析,在实验

2、之前我们组在一起综合上面的方法商量并确定了分析什么数据?需要多少数据?如何进行各种数据的平衡?又需要什么转换才能进行有效的挖掘?如何对挖掘结果进行处理?如何提高借阅者的借阅效率和图书管理员的管理效率等;(2)任务:我们组每个人都根据自己的偏好选择了分析问题的角度,我选择的是关联分析方法,即通过关联法挖掘出图书借阅者所借阅书籍之间的关系,进行挖掘系统部署后,可建议图书管理员对书籍的摆放根据挖掘结果的规则进行一定程度的调整,进而方便借阅者的借阅和图书管理员的管理。1.2数据理解即了解目前的数据状况。1.需要的数据及含义:(1)读者信息(借阅证号,姓名,性别,类型,最长可保留天

3、数),其中借阅证号是主键;(2)读者借阅信息(借阅证号,书名,作者,出版社,出版日期),其中借阅证号和书名两个都是主键,但读者借阅信息中的借阅证号是参照读者信息中的借阅证号而来。2挖掘(或分析)数据准备(1)读者信息(借阅证号,姓名,性别,类型,最长可保留天数),其中借阅证号是主键;设计如下:(2)读者借阅信息(借阅证号,书名,作者,出版社,出版日期),其中借阅证号和书名是主键,设计如下:12(3)数据库关系图表示如下:(4)相关处理过程如下:1)新建数据源;2)数据源视图分析结果如下:123)新建挖掘结构;把读者信息设置为实例,读者借阅信息设置为嵌套;挖掘模型结构如下:

4、124)钻取结果如下:124)在此设置最小支持度为50%,最小置信度为75%,界面如下:5)建立关联规则模型如下:123数据挖掘(或分析)过程3.1挖掘算法与挖掘软件选择(1)挖掘算法:采用数据挖掘算法中的关联法来分析寻找数据间的关联性,在对候选集进行分析时采用Apriori算法找出频繁项集,进而由频繁项集产生关联规则。(2)挖掘软件选择:MicrosoftVisualStudio2005和MS公司的SQLServer2005DataMining软件。3.2数据预处理(1)12数据预处理是指在数据分析之前,我们通常需要先将数据标准化(Normalization),利用标准

5、化后的数据进行数据分析。数据预处理有助于为数据挖掘提供高质量的数据,良好的数据源是数据挖掘成功的重要保证,但现实的数据源中存在不完整的、异常的和不一致的数据,因此,数据的预处理是进行数据分析、成功实验的基础。例如:本次在对高校图书馆管理系统数据进行分析方案设计之前,我们组采用了头脑风暴法进行分析,然后各自选定和充分明确自己分析和研究问题的目的,然后采用数据清理、数据集成、数据转换和数据归约等技术有效改善数据挖掘的质量。3.3挖掘过程说明数据挖掘过程由以下步骤组成:1.确定业务问题,即理解业务需求,清晰定义业务问题,从而避免迷失在大量数据中。在定义业务问题时,首先要考虑是否

6、有充足的与业务有关的数据,识别数据挖掘分析的数据是否包含需要的模式;其次,需要考虑如何运用已发现的知识。思考如何把数据挖掘的结果应用到业务中有助于洞察业务存在的实际问题。例如:本次在对高校图书馆管理系统数据进行分析方案设计时,数据挖掘的最终目的是通过了解读者的借书模式,确定读者在图书馆进行借书时的规律,图书管理员针对这些规律合理摆放书籍,既方便读者借阅也方便图书管理员的管理;2.数据探测:即数据挖掘在确定业务问题后就要选择相关的数据,这些数据一般用简单文件、文本或数据库表的数据结构表示。分析什么数据?需要多少数据?如何进行各种数据的平衡?又需要什么转换才能进行有效的挖掘?

7、为了解决这些问题就需要进行数据探测,进而整理出包含业务模式的数据。例如:本次在对高校图书馆管理系统数据进行分析方案设计时,我们组进行头脑风暴法来进行决策,进行删减了一部分数据进而得出当前的研究数据;3.数据预处理,即在分析研究之前对数据进行清理、归约、离散化处理和概念提升等操作,先将数据标准化(Normalization),利用标准化后的数据进行数据分析,数据预处理有助于为数据挖掘提供高质量的数据,良好的数据源是数据挖掘成功的重要保证;4.数据挖掘,本次在对高校图书馆管理系统数据进行分析方案设计时,采用数据挖掘算法中的关联法来

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。