多值属性关联规则的研究与实现

多值属性关联规则的研究与实现

ID:33291706

大小:2.00 MB

页数:55页

时间:2019-02-23

多值属性关联规则的研究与实现_第1页
多值属性关联规则的研究与实现_第2页
多值属性关联规则的研究与实现_第3页
多值属性关联规则的研究与实现_第4页
多值属性关联规则的研究与实现_第5页
资源描述:

《多值属性关联规则的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西安科技大学硕士学位论文多值属性关联规则的研究与实现姓名:易季辉申请学位级别:硕士专业:计算机应用技术指导教师:杨君锐20080415论文题目:专业:硕士生:指导教师:多值属性关联规则的研究与实现计算机应用技术易季辉(签名)杨君锐(签名)摘要在信息爆炸的时代,面对“人们被数据淹没,同时却仍然感到知识饥饿”的挑战,数据挖掘技术应运而生,并得以蓬勃发展。关联规则挖掘是一个重要的研究领域。目前对其的研究主要是集中在以支持.信任理论为基础对布尔型数据进行挖掘,并且已取得了一些研究成果,要从这些数据中挖掘潜在的规则,现有的布尔型关联

2、规则方法就显得力不从心了。如何划分区段是实现多值属性关联规则问题到布尔型关联规则问题转变的关键。挖掘多值属性关联规则的关键步骤是把数值型属性所在的域分成多个区间。在划分区段方面,现有的方法多是把数值属性所在的域划分成等宽的或等深的区间,或者在一个(或一组)属性上使用聚类算法。虽然这些算法能很好的解决多值型的数据挖掘问题,但是不能避免最小支持度和最小可信度冲突的问题,而且有可能错过一些重要的规则。本文所提方法是,把一个交易作为一个a维向量,并且在多个n维向量上对所有属性使用迭代自组织的数据分析算法(ISODATA)进行聚类。

3、由于ISODATA的试探特性,并且可以结合成人机交互的结构,使其能利用中间结果所取得的经验更好地进行分类。把聚类投影到数值型属性所在的区间形成可能重叠的区间,最后使用布尔型关联规则挖掘算法来挖掘关联规则。该算法既考虑了交易之间的距离,又考虑了属性之间的关系,而且能避免最小支持度和最小可信度之间的冲突。实验结果显示,该方法能有效地挖掘多值属性关联规则,而且能够发现可能被以前的算法错过的重要的规则。关键词:数据挖掘;关联规则:多值属性;频集;聚类研究类型:理论研究Subject:TheResearchandImplementa

4、tionofQuantitativeAssociationRulesSpecialty:ComputerApplicationTechnologyName:YiJiHuiInstructor:YangJunRuiABSTRACT(Signature(SignatureIntheeraofinformationexplosion,facedtothechallengesthat‘'peopleweredrowneddata,whilestillfeelknowledgehunger'’,dataminingtechnique

5、shaveemeBedandflourish.Dataminingofassociationruleshasbecomeallimportantresearcharea.Thecurrentresearchalemostlybasedonthesupport-confidencetheoryofbooleandatamining,andmadesomeresearchacllievemenB,buttheexistedmethodsofbooleanassociationrulesfromthesedataminingpo

6、tentialrulesareinsufficient.Thecriticalofquantitativeassociationrulesproblemtobooleanassociationrulesproblemchangingisbowtodividethesections.Thecriticalpartofquantitativeassociationruleminingistopartitionthedomainsofquantitativeattributesintointervals.Theexistedme

7、thodsindividethesectionsdealt、Ⅳitllthisproblembydividingthedomainsofquantitativeattributesintoequi-depthorequi-widthintervals,orusingaclusteringalgorithmonasingleattribute(orasetofattributes)alone.Althoughthesealgorithmscallbesatisfactorilyresolvedquantitativedata

8、mining,butCannotavoidtheconflictbetweentheminimumsupportandtheminimumconfidenceproblem,andriskmissingsomeimportantrules.Inthispaper,theproposedmethodist

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。