数据挖掘理论与技术实验

数据挖掘理论与技术实验

ID:36630054

大小:697.44 KB

页数:36页

时间:2019-05-13

数据挖掘理论与技术实验_第1页
数据挖掘理论与技术实验_第2页
数据挖掘理论与技术实验_第3页
数据挖掘理论与技术实验_第4页
数据挖掘理论与技术实验_第5页
资源描述:

《数据挖掘理论与技术实验》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、知识挖掘理论与技术实验魏玮河北工业大学计算机科学与软件学院2008年12月9日0目录实验一完全立方体的计算..................................................................................................2实验二Apriori算法发现频繁项集......................................................................................4实

2、验三使用FP增长算法挖掘频繁项集............................................................................6实验四贝叶斯分类算法.......................................................................................................9实验五后向传播分类算法........................................

3、.........................................................11附录一实验报告书写格式...................................................................................................15附录二MATLAB编程简介..........................................................................

4、.......................16附录三参考程序...................................................................................................................261实验一完全立方体的计算一、实验目的和要求1)熟悉Matlab编程算法;2)掌握由基本立方体聚集产生各层方体的方法,即完全物化技术。二、实验原理数据仓库和OLAP工具基于多维数据模型,这种模型将数据看作数据立方体形式也

5、就是对n维数据建模。在OLAP服务器实时回答决策支持查询时,对数据立方体的计算速度有较高的要求。为解决这个问题,常采用对数据立方体预计算的方法。给定基本方体,数据立方体的物化有三种选择:1)不物化:不预计算任何“非基本”方体2)完全物化:预计算所有方体;3)部分物化:有选择地计算整个可能的方体集中一个适当的子集。三、实验内容和步骤1、实验内容1)由AllEllectronics销售在time、item和location维的3-D数据编程建立相应的3-D数据立方体表示;2)将得到的3-D数据立方体视为基本立方体,

6、并编程对它进行完全物化,即预计算所有方体;3)在实验报告中画出程序框图;4)在实验报告中画出相应的方体格。2、实验步骤编程实现如下功能:1)将AllEllectronics销售数据用Matlab语言表示成3维矩阵的形式记为tim_ite_loc;22)分别沿time、item和location聚集,得到2-D方体;3)再对2-D方体聚集,得到1-D方体;4)对1-D方体聚集,得到顶点方体。四、实验数据Location=“芝加哥”itemLocation=“纽约”itemtime家庭娱乐计算机电话安全家庭娱乐计算

7、电话安全机Q185488289623108796838872Q2943890646981130102441925Q310329245978910341048451002Q41129992638701142109154984Location=“多伦多”itemLocation=“温哥华”itemtime家庭娱乐计算机电话安全家庭娱乐计算电话安全机Q18187464359160582514400Q28947695268268095231512Q394079558728812102330501Q49788645978

8、49271038385803实验二Apriori算法发现频繁项集一、实验目的和要求1)进一步熟悉Matlab编程算法;2)掌握使用Apriori算法从事物数据库中挖掘频繁项集的方法。二、实验原理1、Apriori算法Apriori使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描数据库,累计每个项的计数,并收集满足最小支持度的项,找出频繁1项集的集合。该集合记

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。