在数据库中挖掘定量关联规则的方法研究

在数据库中挖掘定量关联规则的方法研究

ID:37593672

大小:268.60 KB

页数:8页

时间:2019-05-25

在数据库中挖掘定量关联规则的方法研究_第1页
在数据库中挖掘定量关联规则的方法研究_第2页
在数据库中挖掘定量关联规则的方法研究_第3页
在数据库中挖掘定量关联规则的方法研究_第4页
在数据库中挖掘定量关联规则的方法研究_第5页
资源描述:

《在数据库中挖掘定量关联规则的方法研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第4卷第4期管 理 科 学 学 报Vol.4No.42001年8月JOURNALOFMANAGEMENTSCIENCESINCHINAAug.,2001①在数据库中挖掘定量关联规则的方法研究程 岩,卢 涛,黄梯云(哈尔滨工业大学管理学院,哈尔滨150001)摘要:数据挖掘技术是实现智能决策支持系统的一个重要手段,关联规则是数据挖掘的一个重要内容.传统的Apriori算法仅适用于挖掘数据间的定性关联关系,但数据间的定量关联关系对决策更有帮助.属性值的离散映射是挖掘定量关联规则的一个重要环节,离散映射中属性值区间的划分粒度是影响数据挖掘质量的一个重要因素.本文结合粗集理论提出

2、了一个确定属性值划分粒度的方法,在此基础上设计出一个挖掘定量关联规则的算法:Apriori2,利用Apriori2可以挖掘出大量对决策有帮助的定量关联规则.关键词:数据挖掘;智能决策支持系统;关联规则;粗集中图分类号:TP311文献标识码:A文章编号:100729807(2001)04200412080 引 言交易是否包含某商品,而对交易量没有定量描述,这种布尔类型数据间的关联规则被称为定性关联随着信息系统的建设和发展,许多企业和组规则.但数据记录的属性往往是数值型或字符型织积累了大量的数据,而数据本身不是信息,隐含的,这些数据间也存在对决策有帮助的关联规则,在数据中的规

3、则、模式等知识才是对决策有帮助相对于定性关联规则,这些规则被称为定量关联[2,7]的信息.数据挖掘的目的就是发现隐含在数据中规则.表1 商品交易表对决策有帮助的信息,它是实现智能决策支持系[1]IDABCDE⋯统的一个重要手段.关联规则是数据挖掘的一个重要内容,通常1110100关联规则反映的是数据间的定性关联关系.表12111100为一个商品交易数据库,一条记录表示用户一次⋯⋯⋯⋯⋯⋯⋯购买的商品种类,每个属性(A,B⋯)代表一种商  在定量关联规则的挖掘中主要有两个步骤:品,每个属性都是布尔类型的.一条关联规则的例(1)将属性值按一定的划分区间映射为标准子是:{A,B

4、}→{D}[2%][60%],规则的含义是的离散值.这个过程的一个主要问题是如何确定“如果用户购买商品A和B,那么也可能购买商合理的属性值划分区间.品D,因为同时购买A,B和D的交易记录数占总(2)从离散映射后的数据集中挖掘出定量关交易数的2%,而购买A和B的交易中,有60%联规则.由于属性值的划分区间不只有两个,属性的交易也包含D”.规则中60%是规则的信任度,值不能仅仅离散映射为0,1两个值,因此不能用[3-6]2%是规则的支持度.数据挖掘就是要发现所传统的定性关联规则的挖掘算法挖掘定量关联有满足用户定义的最小信任度和支持度阀值限制规则.的关联规则.表1中的数据只是定

5、性地描述一个针对上述两个步骤中存在的问题,结合粗集①收稿日期:1999211222;修订日期:2000204218.基金项目:国家自然科学基金资助项目(70071008).作者简介:程岩(19672),男,博士生.©1995-2005TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.—42—管 理 科 学 学 报              2001年8月理论和概念树理论提出了一个确定属性值划分区是一个k元特征描述,其中Ci∈C,Ki∈V,k元特间的算法k,并在挖掘定性关联规则的Apriori算征描述X的表达式中的任一

6、个等式(Ci=Ki)称法基础上设计出一个挖掘定量关联规则的算法kk为X的一元子句;令1≤i

7、和信任度就库,其中U={u1,u2,⋯,uN}是数据记录的集合;可以判断关联规则X→Y是否成立.根据关联规数据记录的属性间往往存在决定和被决定的关则的定义,特征集[X]的支持度与信任度的计算系,令C为决定属性的集合,称为条件属性集,D公式为为被决定属性的集合,称为决策属性集,且要求card([X]∩[Y])card([X]∩[Y])C∩D=Á;令A=C∪D;V表示所有属性可取s=,c=card([U])card([X])值的集合;f:U×A→V是一个信息函数,该函数式中运算符card()是求集合中元素的个数.令A为某个数据记录

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。