apriori关联分析数据挖掘

apriori关联分析数据挖掘

ID:11448582

大小:360.94 KB

页数:13页

时间:2018-07-12

apriori关联分析数据挖掘_第1页
apriori关联分析数据挖掘_第2页
apriori关联分析数据挖掘_第3页
apriori关联分析数据挖掘_第4页
apriori关联分析数据挖掘_第5页
资源描述:

《apriori关联分析数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘教育科学与技术学院数据挖掘实验报告题目关联分析频繁模式挖掘算法专业计算机科学与技术(专升本)班级计算机专升本2015(2)班姓名郑钢民任课教师江波 13/13数据挖掘2017年1月一、算法简介 Apriori是非常经典的关联分析频繁模式挖掘算法,其思想简明,实现方便,只是效率很低,可以作为频繁模式挖掘的入门算法。其主要特点是: 1、k-1项集连接规律:若有两个k-1项集,每个项集保证有序,如果两个k-1项集的前k-2个项相同,而最后一个项不同,则证明它们是可连接的,可连接生成k项集。 2、反单调性。如果一个项集是频繁的,那么它的所有子集都是频

2、繁的。即若一个项集的子集不是频繁项集,则该项集肯定也不是频繁项集。    主要算法流程:  1.扫描数据库,生成候选1项集和频繁1项集。   2.从2项集开始循环,由频繁k-1项集生成频繁频繁k项集。   2.1 频繁k-1项集两两组合,判定是否可以连接,若能则连接生成k项集。   2.2 对k项集中的每个项集检测其子集是否频繁,舍弃掉子集不是频繁项集即 不在频繁k-1项集中的项集。   2.3 扫描数据库,计算2.3步中过滤后的k项集的支持度,舍弃掉支持度小于阈值的项集,生成频繁k项集。   3. 若当前k项集中只有一个项集时循环结束。   伪代码

3、如下:13/13数据挖掘二、实验目的1、理解频繁模式和关联规则 2、掌握频繁模式挖掘算法Apriori     3、为改进Apriori打下基础三、实验内容1、选定一个数据集2、选择合适的实现环境和工具实现算法,本次试验采用的是java3、根据设置的最小支持度和置信度,给出数据集的频繁模式集四、算法呈现本次实验的数据集是一个模拟蘑菇生长的环境mushroom数据是适合蘑菇生长的环境的feature数据,每一列代表一种蘑菇生长环境的feature,比如温度、湿度、阳光等等。通过频繁模式挖掘,发现适合蘑菇生长的环境因素的频繁模式。开发工具为eclipse

4、。数据集:mushroom.dat13/13数据挖掘数据集展示(部分):13913232534363840525459636776858690939810711323914232634363940525559636776858690939910811424915232734363941525559636776858690939910811513101523253436384152545963677685869093981071132391624283437394053545963677685869094991091142310142326343639

5、41525559636776858690939810811424915232634363942525559636776858690939810811524101523273436394152555963677685869093991071151310152325343638435254596367768586909398110114249142326343639425255596367768586909398107115231014232734363942525559636776858690939910811423101423263436394152

6、55596367768586909398107115249142326343639445255596367768586909399107114131015232534363840525459636776858690939911011323111324283437394153545964677685869094981091142311142327343738445356596367768586909399110116251116242834363840525459636776858690939811011313101323253436384452545

7、963677685869093991071132311142326343738435356596367768586909399110116249142327343639405255596367768586909398107115241014232634363941525559636776858690939910711413/13数据挖掘2310142327343639415257596567768586909398111117231113242834363842525459636776858690939811111313101523253436384

8、352545963677685869093991101142391423263436394452555963

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。