欢迎来到天天文库
浏览记录
ID:33185228
大小:1.72 MB
页数:57页
时间:2019-02-21
《基于扩展概念格的多数据源分类知识融合问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP393密级:单位代码:fm椭;鼎晰学号:“。111:4
2、!I二⋯!”‘:仑肥工学夫警HefeiUniversityofTechnology硕士学位论文MASTERDISERTATIoNo论文题目:基于扩展概念格的多数据源分类知识融合问题研究学位类别:学历硕士,孝燃l计算机软件与理论(工程领域)“⋯”⋯”1~‘作者姓名:导师姓名:完成时间:马冯胡学钢教授2006t#-4月基于扩展概念格的多数据源分类知识融合问题研究摘要数据挖掘领域里,分类问题一直以来都是的一个重要研究分支。在当前多数据源数
3、据日益普及的情况下,对数据挖掘领域中分类问题的研究也提出了新的挑战,例如如何从多个数据源中提取出分类知识,并加以有效的融合。因此,研究一种有效的多数据源分类知识融合方法己成为当前数据库中知识发现的一个重要的研究方向。概念格,是一种通过概念间的内涵和外延以及例化和泛化的关系来表示知识的模型。在概念格的内涵中引入等价关系,便可得到概念格的扩展模型,即扩展概念格,这种模型更加有利于分类知识的提取。本文的主要研究内容如下:1.采用基于扩展概念格的方式,首先在每个数据源上建立对应的扩展概念格,然后从中提取出所
4、需的分类知识,再加以有效的融合。文中涉及到了两种方式的知识表现形式:分类规则和分类子格,和与它们相对应的两种融合机制。对于这两种融合机制所得到的分类知识的完备性,都在文中给与了理论证明和实验验证。2。对概念格扩展模型采用预剪枝的策略,来抑制过拟合现象的出现。概念格扩展模型具有较高的模型复杂度,一方面使其能够对训练数据集进行十分准确的分类,另一方面有会使得它很容易引起模型“过度拟合”现象的出现,从而影响到分类器在实际测试数据上的准确率;对此文中采用了对格进行预剪枝的方法。阻止格中部分不必要的分支的出现
5、,从而降低模型的复杂度,避免模型过度拟合现象的出现。3.在上述研究工作的基础上,实现了基于多扩展概念格的分类知识发现原型系统。关键词:数据挖掘,KDD,概念格,多数据源,分类子格IllTheResearchonMulti·-DatasoureeClassificationAmalgamationbasedontheExtendingofConceptLatticeAbstractClassificationhasalwaysbeenanimportantsub-branchofDataMining.
6、Nowadays,moreandmoreMulti—Datasourcedatacomingintopeople’Sdailylife,andthisalsobringsnewchallengeintoDataMiningfield,suchashowtodiscoveryknowledgefromthiskindofdataandamalgamatethemeffectively.Therefore,theresearchonhowtoamalgamateclassifyknowledgeeffi
7、cientlyfrommulti—datasourcecomestobeaimportantdirectiononthisfield.ConceptLatticeisamodel,whichrepresentstheknowledgewiththerelationbetweentheintensionsandtheextensionofconcepts,andtherelationbetweenthegeneralizationandthespecializationbetweenconcepts.
8、ByintroducingequivalentintensionintoConceptLattice,wegottheExtendingFormalofConceptLattice(ECL),whichisanefficienttooltodiscoveryclassificationrules.ThecontentofthedissertationiSasfollows:1.AllmeasuresmentionedisthisarticlewerebasedonExtendingFormalofC
9、onceptLattice.Firstly,buildECLmodelrespectivelyreferringtoeachsite;afterthat,extractknowledgefromeachmodel;finally,amalgamatingthemeffectively.Twokindsofclassifyknowledge,classifyrulesandclassifysub·lattice,wereusedhereandtheircorrespon
此文档下载收益归作者所有