欢迎来到天天文库
浏览记录
ID:36630054
大小:697.44 KB
页数:36页
时间:2019-05-13
《数据挖掘理论与技术实验》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、知识挖掘理论与技术实验魏玮河北工业大学计算机科学与软件学院2008年12月9日0目录实验一完全立方体的计算..................................................................................................2实验二Apriori算法发现频繁项集......................................................................................4实
2、验三使用FP增长算法挖掘频繁项集............................................................................6实验四贝叶斯分类算法.......................................................................................................9实验五后向传播分类算法........................................
3、.........................................................11附录一实验报告书写格式...................................................................................................15附录二MATLAB编程简介..........................................................................
4、.......................16附录三参考程序...................................................................................................................261实验一完全立方体的计算一、实验目的和要求1)熟悉Matlab编程算法;2)掌握由基本立方体聚集产生各层方体的方法,即完全物化技术。二、实验原理数据仓库和OLAP工具基于多维数据模型,这种模型将数据看作数据立方体形式也
5、就是对n维数据建模。在OLAP服务器实时回答决策支持查询时,对数据立方体的计算速度有较高的要求。为解决这个问题,常采用对数据立方体预计算的方法。给定基本方体,数据立方体的物化有三种选择:1)不物化:不预计算任何“非基本”方体2)完全物化:预计算所有方体;3)部分物化:有选择地计算整个可能的方体集中一个适当的子集。三、实验内容和步骤1、实验内容1)由AllEllectronics销售在time、item和location维的3-D数据编程建立相应的3-D数据立方体表示;2)将得到的3-D数据立方体视为基本立方体,
6、并编程对它进行完全物化,即预计算所有方体;3)在实验报告中画出程序框图;4)在实验报告中画出相应的方体格。2、实验步骤编程实现如下功能:1)将AllEllectronics销售数据用Matlab语言表示成3维矩阵的形式记为tim_ite_loc;22)分别沿time、item和location聚集,得到2-D方体;3)再对2-D方体聚集,得到1-D方体;4)对1-D方体聚集,得到顶点方体。四、实验数据Location=“芝加哥”itemLocation=“纽约”itemtime家庭娱乐计算机电话安全家庭娱乐计算
7、电话安全机Q185488289623108796838872Q2943890646981130102441925Q310329245978910341048451002Q41129992638701142109154984Location=“多伦多”itemLocation=“温哥华”itemtime家庭娱乐计算机电话安全家庭娱乐计算电话安全机Q18187464359160582514400Q28947695268268095231512Q394079558728812102330501Q49788645978
8、49271038385803实验二Apriori算法发现频繁项集一、实验目的和要求1)进一步熟悉Matlab编程算法;2)掌握使用Apriori算法从事物数据库中挖掘频繁项集的方法。二、实验原理1、Apriori算法Apriori使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描数据库,累计每个项的计数,并收集满足最小支持度的项,找出频繁1项集的集合。该集合记
此文档下载收益归作者所有