weka关联规则使用

weka关联规则使用

ID:42624784

大小:232.50 KB

页数:11页

时间:2019-09-19

weka关联规则使用_第1页
weka关联规则使用_第2页
weka关联规则使用_第3页
weka关联规则使用_第4页
weka关联规则使用_第5页
资源描述:

《weka关联规则使用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、前面几篇介绍了关联规则的一些基本概念和两个基本算法,但实际在商业应用中,写算法反而比较少,理解数据,把握数据,利用工具才是重要的,前面的基础篇是对算法的理解,这篇将介绍开源利用数据挖掘工具weka进行管理规则挖掘。weka数据集格式arffarff标准数据集简介weka的数据文件后缀为arff(Attribute-RelationFileFormat,即属性关系文件格式),arff文件分为注释、关系名、属性名、数据域几大部分,注释用百分号开头%,关系名用@relation申明,属性用@attribute什么,数据域用@data开头,看这个示例数据集(安装weka后,可在

2、weka的安装目录/data下找到weather.numeric.arff):%weatherdataset@relationweather@attributeoutlook{sunny,overcast,rainy}@attributetemperaturenumeric@attributehumiditynumeric@attributewindy{TRUE,FALSE}@attributeplay{yes,no}@datasunny,85,85,FALSE,nosunny,80,90,TRUE,noovercast,83,86,FALSE,yesrainy,70,

3、96,FALSE,yesrainy,68,80,FALSE,yesrainy,65,70,TRUE,noovercast,64,65,TRUE,yessunny,72,95,FALSE,nosunny,69,70,FALSE,yesrainy,75,80,FALSE,yessunny,75,70,TRUE,yesovercast,72,90,TRUE,yesovercast,81,75,FALSE,yesrainy,71,91,TRUE,no当数据是数值型,在属性名的后面加numeric,如果是离散值(枚举值),就用一个大括号将值域列出来。@data下一行后为数据记录,

4、数据为矩阵形式,即每一个的数据元素个数相等,若有缺失值,就用问号?表示。arff稀疏数据集我们做关联规则挖掘,比如购物篮分析,我们的购物清单数据肯定是相当稀疏的,超市的商品种类有上10000种,而每个人买东西只会买几种商品,这样如果用矩阵形式表示数据显然浪费了很多的存储空间,我们需要用稀疏数据表示,看我们的购物清单示例(basket.txt):freshmeatdairyconfectioneryfreshmeatconfectionerycannedvegfrozenmealbeerfishdairywinefreshmeatwinefishfruitvegsoftd

5、rinkbeerfruitvegfrozenmealfruitvegfishfruitvegfreshmeatdairycannedvegwinefishfruitvegfishdairycannedmeatfrozenmealfish 数据集的每一行表示一个去重后的购物清单,进行关联规则挖掘时,我们可以先把商品名字映射为id号,挖掘的过程只有id号就是了,到规则挖掘出来之后再转回商品名就是了, retail.txt 是一个转化为id号的零售数据集,数据集的前面几行如下:01234567891011121314151617181920212223242526272830

6、313233343536373839404142434445463839474838394849505152535455565758324159606162339486364656667683269  这个数据集的商品有16469个,一个购物的商品数目远少于商品中数目,因此要用稀疏数据表,weka支持稀疏数据表示,但我在运用apriori算法时有问题,先看一下weka的稀疏数据要求:稀疏数据和标准数据的其他部分都一样,唯一不同就是@data后的数据记录,示例如下(basket.arff): @relation'basket'@attributefruitveg{F,T}

7、@attributefreshmeat{F,T}@attributedairy{F,T}@attributecannedveg{F,T}@attributecannedmeat{F,T}@attributefrozenmeal{F,T}@attributebeer{F,T}@attributewine{F,T}@attributesoftdrink{F,T}@attributefish{F,T}@attributeconfectionery{F,T}@data{1T,2T,10T}{1T,10T}{3T,5T,6T,9T}{2T,7T}{

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。