基于概念层次树的数据挖掘算法及应用研究

基于概念层次树的数据挖掘算法及应用研究

ID:32372523

大小:87.79 KB

页数:3页

时间:2019-02-03

基于概念层次树的数据挖掘算法及应用研究_第1页
基于概念层次树的数据挖掘算法及应用研究_第2页
基于概念层次树的数据挖掘算法及应用研究_第3页
资源描述:

《基于概念层次树的数据挖掘算法及应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第3期肖娟等:基于概念层次树的数据挖掘算法及应用研究·61·*基于概念层次树的数据挖掘算法及应用研究12肖娟,叶枫(1.浙江工业大学之江学院经贸管理系,浙江杭州310024;2.浙江工业大学经贸管理学院,浙江杭州310014)摘要:概念层次树在大规模数据挖掘中已得到广泛应用。在介绍基于概念层次树的数据挖掘算法的基础上,针对已有数值型数据概念提升算法的不足,提出了改进后的算法,并通过数据测试给出两种算法的比较效果和应用实例。关键词:概念层次;数据挖掘;阈值中图法分类号:TP391文献标识码:A文章编号

2、:1001-3695(2005)03-0061-03ResearchonDataMiningAlgorithmBasedonConceptionHierarchyTreeandItsApplication12XIAOJuan,YEFeng(1.Dept.ofEconomicManagement,ZhejiangCollege,ZhejiangUniversityofTechnology,HangzhouZhejiang310024,China;2.CollegeofEco-nomicManageme

3、nt,ZhejiangUniversityofTechnology,HangzhouZhejiang310014,China)Abstract:Conceptionhierarchytreeclassifiershavefoundthewidestapplicabilityinlarge-scaledataminingenvironments.Afterintroducedadataminingalgorithmbasedonconceptionhierarchytree.Thispaper,int

4、helightofthelimitationsofexistedconceptassensionalgorithmtonumericalattributesindatabase,introducesanimprovedalgorithm.Moreover,theresultoftwoalgorithmtestingonactualdataisprovidedinthispaper.Keywords:ConceptionHierarchy;DataMining;Threshold目前常用的各类数据挖掘

5、算法,主要用于特征规则、关联是最一般的概念层次树,常包含全部可能的属性值以及它们对规则、分类规则、序贯模式的发现,但将这些算法用于实际的大应的全部可能的父概念。这种概念树对于特定的数据库显得型数据库进行知识发现,却不能取得很好的效果。概念层次树偏大,并且影响到概念提升的速度,因而缺乏一定的灵活性和作为数据分类的方法,可以将大量详细的细节数据总结上升到针对性。通常,无论是领域专家定义还是自动生成概念层次[1]较高的概念层,为数据挖掘的各个步骤提供背景知识,提高知树,概念层次树的构造有自顶向下和自底向上

6、两种方式。识的准确性和可理解性。适合用户需要较高层次的、能反映一粤灶赠定关系的规则来支持决策的实际应用,此外可用于对数据预处约员愿穴其他年龄雪员愿耀缘园穴中青年雪跃缘园穴老年雪理得到清洁的元数据及知识表示。噎源耀员苑穴少年雪员愿耀猿源穴青年雪猿缘耀缘园穴中年雪噎本文试图对基于概念层次树的数据挖掘算法有所改进,如图员年龄概念层次树实现层次自动提取与概念提升同步的数据挖掘算法,非均匀分布下数据的概念层次的自动提取等功能。所以对于数据库中常常存在各种数值型属性的情况,一般采用自动生成数值型概念层次的概念化

7、方法:由用户指定期望1概念层次及概念层次树的分段数,由机器自学习,将属性值分成若干个区间。该方法可满足大型数据库中特殊挖掘任务的要求,它能针对特殊挖掘所谓概念层次H就是部分有序集(h,;),其中h是有限概念集合,;是h上的部分有序关系。概念层次能够以层次的任务的要求构造专门的概念层次,反映特殊数据集合中的数据分布。本文正是对面向数值型数据构建概念层次树的数据挖形式和偏序的关系组织数据和概念。如我们取一般———特殊的关系为;,可以表示城市、省份的关系,如杭州;浙江省;中掘方法提供一些建议和改进。国。通

8、常我们以层次树来表示一个概念层次,即概念层次树2基于概念层次树的数据挖掘算法(ConceptHierarchyTree),树的节点表示概念,树枝表示偏序。图1是客户年龄的概念层次树。[2]基于概念层次树的数据挖掘方法的基本思想是:首先,概念层次树可由领域内的专家提供,但在实际评估中,因一个属性的较具体的值被该属性和概念层次树中的父概念所为数据规模很大,协调专家之间的意见非常困难,人工定义大代替;然后,对知识基表中出现的相同记录进行合并,构成更宏型的概念层次树亦不合理、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。