挖掘多值关联规则的研究

挖掘多值关联规则的研究

ID:33465168

大小:1.71 MB

页数:70页

时间:2019-02-26

挖掘多值关联规则的研究_第1页
挖掘多值关联规则的研究_第2页
挖掘多值关联规则的研究_第3页
挖掘多值关联规则的研究_第4页
挖掘多值关联规则的研究_第5页
资源描述:

《挖掘多值关联规则的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、北方交通大学硕士学位论文挖掘多值关联规则的研究姓名:苏立申请学位级别:硕士专业:计算机应用指导教师:黄厚宽19990101摘爱挖掘多值关联规则的研究摘要.1数据挖掘是当今人工智能、数据库、统计学等学科中一个非常活跃的研究领域j数据挖掘(DataMining)是近年来人工智能、统计学、数据库等领域研究的热点之一。—卜方面由于各种商业管理、政府办公、工程开发、科学研究等所涉及的数据量急剧增加,超出了人和传统方法的分析和处理能力。另~方面由于当今计算机和网络通讯技术的飞速发展,即成本的降低和性能的提高以及数据库技术和人工智能等领域的进

2、步,使数据挖掘成为必要和可能。在本文中,我们讨论在包含有多值属性和类别属性的大规模关系表中挖掘关联规则的问题。一个这样关联的例子是:“年龄在50一60之间的已婚人中,有10%至少拥有两辆汽车”。我们通过较好地划分属性值和在必要的情况下台并相邻划分来处理多值属性。在处理多值属性的过程中,目标和领域知识通常是很重要的ol本文针对挖掘关联规则中遇到的多值属性和类别属性问题,提出基于数据本身的分布状况并根据关联规则的特点对多值属性和类别属性进行划分,进而将挖掘多值属性的关联规则问题转化为布尔属性的关联规则问题。又介绍了一种用部分完整性方

3、法来量化由于划分丢失的信息。直接使用该方法会导致产生大量相似规则的问题。我们通过使用一种“大于期望值”的方法,即在输出中标记出有意义的规则,来解决这一问题。我们提出了一个挖掘这类多值关联规则的方法。最后,在一个人工数据库上进行了实验并描述了实验结果。’i目前,在数据库中挖掘描述数据属性间关联规则的算法有不少缺陷:】产生有较小支持度关联规则的应用需要大量的运行时间。2.都假设挖掘对象是静态数据库。而一些应用要求从动态数据库中产生实时关联规则,即数据库信息需要连续地被增加或删除,而目前还没有一个算法能满足这样的应用。摘要3,已有算法

4、只能发现这样的关联规则:属性的一个台取蕴含着另一个不同属性的合取。事实上,在许多情况下属性的一个合取蕴含另一个合取只能产生特定属性的排斥性,而至今还没有算法能产生这种排斥性关联规则。)一我们提出了一个产生关联规则的方法能解决上述三个问题,该方法特别适用于二进制属性的文本数据库。该算法的核心在于对必要的数据库统计进行快速索引时使用了Patriciatrie结构。并在~个人工数据库上验证了该方法,得出了令人满意的结田‘,禾。,√关键字:数据挖掘,凄数据库1中曲知识发现,关联规则,多值?7日}瀑瞵别属性,频繁项集,、Trie,Patr

5、icia,排斥关联规则}I】AbstractResearchofMiningQuantitativeAssociationRulesDataMiningisofinteresttoresearchersofmanyareassuchasartificjalinte】1igence,databases,statistics,etc.Ontheonehand,alargevolumeofdatafromcommerce,government,industry,seienoeisbeyondtheabilityofmanandtrad

6、jtionalmethods.Ontheotherhand.withthedevelopmentofcomputertechnology,databasestechnologyandartificialintelligenee,itjSimperativeandpossibletodosomeworkondatamining.Weintroducetheproblemofminingassociationrulesin]argerelationaltablescontainingbothquantitativeandeatego

7、rjcatattributes.Anexampleofsuchanassociationmightbe“10%ofmarriedpeeplebetweenage50and60haveatleast2cars”.Wedealwithquantitativeattributebyfine—partitioningthevaluesoftheattributeandthencombiningadjacentpattitionsasnecessary.InprocessofpartiLjoningquantitativeattribut

8、es,thegoa】anddomainknow]edgeareoftenimportant.Topartitionquantitativeattributesforminingassociationrules,amethodbasedonthedatadistr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。