基于领域知识的面向分类的属性泛化分析

基于领域知识的面向分类的属性泛化分析

ID:28860496

大小:10.92 MB

页数:54页

时间:2018-12-14

基于领域知识的面向分类的属性泛化分析_第1页
基于领域知识的面向分类的属性泛化分析_第2页
基于领域知识的面向分类的属性泛化分析_第3页
基于领域知识的面向分类的属性泛化分析_第4页
基于领域知识的面向分类的属性泛化分析_第5页
资源描述:

《基于领域知识的面向分类的属性泛化分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于领域知识的面向分类的属性泛化研究摘要数据规模的急剧增长使得数据挖掘越来越重要。当前的数据挖掘方法对数据的取值基本上是单一层次的,而实际领域中数据的取值可能随着用户的任务需求而需要进行适当的层次变换。由于现实中领域知识的丰富性及复杂性,可能有不同的层次变换方向及取值可利用(即多重多层次化变换MRML),而且不同取值与问题的相关性存在较大差异。因此,本文针对这类具有多重多层次的属性泛化问题展开了研究。论文的主要研究内容如下:(1)详细地讨论了领域知识的各种不同的知识表示模型,探讨了由不同知识表示模型表示的领域知识在知识发现过

2、程各个阶段中的重要作用,展现了基于领域知识的知识发现的应用前景及所面临的挑战。(2)描述了概念层次的基本概念以及表示方法,在此基础上,构建了多重多层次属性泛化模型,表示了具体多种泛化路径的属性间的关系,并建立了基于分类的泛化模型,用于控制属性层次变换。(3)在多重多层次属性泛化模型的基础上,提出一种基于MRML泛化关系的分类规则泛化学习方法(CGDK),该方法根据具体发现任务的需求和当前实际数据库的内容,通过误分类率的控制,在挖掘的过程中选择最紧凑的泛化层次和路径对属性进行泛化,以得到符合用户个性化要求的优化的分类规则。(4

3、)在上述研究的基础上,构建了面向分类的多重多层次属性泛化原型系统(MRMLCGDK)。关键词:数据挖掘领域知识多重多层次泛化分类ResearchofAttributeGeneralizafiontowardsClassificationbasedonDomainKnowledgeABSTRACTDataminingbecomemoreandmoreimportantduetothesharplyincreaseindatascale.Nowadays,dataminingtechniquesalwaysuseoriginal

4、levelofthedatatomine,however,thevalueofthedatacanbelevel—exchangedaccordingtothecustomer’Sdemandsinrealapplications.Becauseoftheabundanceandcomplexityintherealfields,manyattributeshavedifferentmethodsandvaluestogeneralizeunderdifferentconditions(theMulti.relational

5、andMulti—level,MRMLforshort),andthereistremendousdifferencebetweendatavaluesandtherelativityofproblems.Therefore,theproblemofgeneralizationtowardsmulti—relationalandmulti-levelattributesisresearchedbythisdissertation.Theorganizationofthisdissertationisasfollows:(1)

6、Differentknowledgerepresentationmodelsinthefieldofdomainknowledgearediscussedindetail.Thesignificantroleofdomainknowledgerepresentedindifferentmodelsintheprocessofdataminingisdiscussed.Thefutureapplicationsandchallengesofknowledgediscovering,basedonthedomainknowled

7、ge,areexhibited.(2)Basicconceptandrepresentationoftheconceptllierarchyisdescribed.AndaMRMLgeneralizationmodelisconstructedtoexpresstherelationofattributesinspecificmulti—generalizationways.Ageneralizationmodelforclassificationisconstructedtocontrollevel—exchangingo

8、fattributes.(3)Ageneralizationmethodforobtainingclassificationrules(CG_DK),basedonMRML,isproposed.Thismethodchoosesthemostcompactgeneralizationle

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。