欢迎来到天天文库
浏览记录
ID:34142798
大小:2.12 MB
页数:55页
时间:2019-03-03
《基于语义的决策树挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、中国石油大学(华东)硕士学位论文基于语义的决策树挖掘算法研究姓名:褚希申请学位级别:硕士专业:计算机应用技术指导教师:时念云20080501摘要传统决策树算法通过计算属性的信息熵来选择属性,信息熵大的属性被优先选取构造决策树。在计算信息熵时,它仅考虑语法层面上字、词的简单匹配,没有考虑数据的语义信息,缺乏对其所包含语义信息的理解,这就导致算法缺乏一定的智能性,致使计算工作量大、复杂性强,而且分类质量不高。特别是在大数据库的应用上,传统的决策树算法更加面临大数据量计算的挑战。本文在分析研究决策树挖掘算法及知网、概念树、语义相似度等相关知识的基础上,针对传统决策树挖掘算法的
2、不足,提出了基于语义的决策树挖掘思想,实现了连续属性语义化和名词型属性语义化的方法,建立了基于语义的决策树挖掘模型。基于语义的决策树挖掘模型较好的利用YN练数据中属性的语义信息,满足用户基于语义的决策树挖掘的需求,实现了一定程度的智能挖掘。实验表明基于语义的决策树挖掘模型能够解决传统决策树挖掘缺乏语义信息的问题、提高数据挖掘系统的知识表示能力,较之传统的决策树挖掘具有更高的效率和预测准确率。关键词:数据挖掘,决策树,概念树,语义,智能ResearchoftheDecisionTreeinDataMiningBasedonSemantemeChuXi(ComputerAp
3、plicationTechnology)DirectedbyAssociateProf.ShiNianyunAbstract硼btraditionaldecisiontreealgorithmtakesinformationgainastheruletochoosetheattributeforclassification.,111eattributethathasthebiggestvalueofinformationgaincallbeselectedfirstlytobuildthedecisiontree.Whilecalculatingthevalueofin
4、formationgai玛thetraditionaldecisiontreealgorithmdoesnotincludesemanticinformation,itonlysimplyconsidersthewords’andcharacters’matchingingrammar,italsolacksoftheunderstandingofthosesernantemeinformationcontainedint11edata.Alloftheaboveresultinlackofintelligenceandleadtoheavycalculation,th
5、ecomplexityandthelow-qualityofclassificationandSOon.Furthermore,thetraditionaldecisiontreealgorithmwillfaceamorebigchallengeforthelargedatabase.Based011theanalysisofthedecisiontreealgorithmandthecorrespondingconceptsuchasHowNet,hierarchytree,sernantemesimilarityandSOon,thispaperproposesa
6、newdecisiontreealgorithmbasedonsernanteme.Thenewalgorithmpresentsthemethodofseparationofcontinuous—attributesandsemantizationofsubstantival-attributes,andbuildsupthesemanteme—baseddecisiontreemodelfordatamining.Thesemanteme-baseddecisiontreemodelCanbetterusethesemantemeinformationaboutth
7、eattributesindatasets;itcallalsomeettheusels’needofdataminingbasedonthesemanteme.Toacertainextent,thesemanteme-baseddecisiontreemodelCanachieveintelligentdatamining.硼1eresultsoftheexperimentsshowthatthesemanteme.baseddecisiontreemodelCannotonlysolvetheproblemoflackingofth
此文档下载收益归作者所有