欢迎来到天天文库
浏览记录
ID:33175366
大小:2.51 MB
页数:61页
时间:2019-02-21
《基于贝叶斯网络的有向图生成森林算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、北京交通大学硕士学位论文基于贝叶斯网络的有向图生成森林算法研究姓名:马健申请学位级别:硕士专业:计算机科学与技术指导教师:胡俊20090601中文摘要摘要:随着数据库应用的不断深化,数据库的规模急剧膨胀,数据挖掘已成为当今研究的热点。数据挖掘的算法有:关联分析、分类和预测、聚类分析。特别是其中的分类问题,是数据挖掘重要的部分之一。由于其使用的广泛性,现己引起了越来越多的关注。鉴于分类问题在数据挖掘中的特殊重要性,引起了广泛的关注和学者们的兴趣。也就出现了很多分类算法,而且近来不断出现很多新的算法用于构建
2、分类器。特别是基于贝叶斯网络的算法。本文首先介绍了数据挖掘技术的基本概念、背景、方法及其中的分类技术。随后阐述了贝叶斯网络的结构定义和构造的一般过程,利用贝叶斯网络模型分类的原理。在综合研究几种贝叶斯分类模型特点的基础上,分析和评价了这些分类模型的优点以及缺点。最后,提出了基于结点排序的有向图生成森林模型和基于边选择的有向图生成森林模型。由于两种模型本身的着眼点不同使得对具有不同特点的数据集的分类效果会有差别。所以,在分类之前应对数据进行简单分析,按照数据集的特点选择适合的分类模型。实验结果表明:基于模
3、型实现的算法在一些数据集上的结果优于其它算法,在大部分数据集上不亚于其它算法。关键词:数据挖掘;贝叶斯分类;有向图生成森林模型;分类算法分类号:TP3们.6jE鏖銮道丕堂亟±堂位论塞△旦§至B△£!ABSTRACTABSTRACT:Withthewidespreadapplicationofdatabases,thescaleofdatabasesexpandsdramatically,anddatamininghasbecomeafocusofresearch.Thealgorithmsofdatam
4、iningincludeassociationanalysis,classifyingandforecasting,andclusteringanalysis.Classificationisoneofthemajorpartsofdataminingwhichhasarousedgeneralconcernduetoitsextensiveusage.Researchersbecomeinterestedinclassificationbecauseit’Sofgreatimportanceindat
5、amining.Manynewclassificationalgorithms,especiallyalgorithmsbasedonBayesiannetwork,havebeenusedtoconstructclassifier.Firstly,thispaperintroducesbasicconcept,background,methodsandclassificationtechniquesofdataminingtechnology.Thenthepaperdefinesconstructi
6、onofBayesiannetwork,andillustratestheprinciplesofclassificationusingaBayesiannetworkmodel.OnthebasisofcomprehensivestudyofseveralBayesiannetworkmodels,thePaperanalyzesandestimatestheadvantagesanddisadvantagesoftheseclassificationmodels.Lastly,thepaperpre
7、sentstwokindsofdirectedForest-Augmentedclassificationmodels·-·-··directedForested·-AugmentedmodelbasedonnodessortinganddirectedForest·Augmentedmodelbasedonedgesselection.Theeffectivenessofclassificationmaydifferfordatasetswithdifferentcharacteristicsbeca
8、usethemodelshavedifferentfocuses.Therefore,thedatashouldbeanalyzedroughlybeforeclassificationandproperclassificationmodelshouldbeselectedaccordingtothecharacteristicsofdatasets.ExperimentsshowthatthealgorithminthisPaperiss
此文档下载收益归作者所有