欢迎来到天天文库
浏览记录
ID:33964356
大小:2.64 MB
页数:97页
时间:2019-03-02
《一种蒙特卡罗贝叶斯分类的改进方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、华中师范大学硕士学位论文一种蒙特卡罗贝叶斯分类的改进方法姓名:秦鑫申请学位级别:硕士专业:电路与系统指导教师:朱绍文20040501⑧硕士学位论文~1^SrER。S7llⅡ:S【S摘要随着信息技术的发展和数据库技术的广泛应用,人们积累的信息越来越多,如何从海量的信息中提取我们感兴趣的知识,是当前社会面临的一个严峻的问题。知识发现技术随时代的发展应运而生【2】.成为目前较热门的研究课题之一。知识发现(KDD)能够从数据库中识别出有效的、新颖的、潜在有用的、以及最终可理解的信息。数据挖掘是知识发现的一个核心环节【2】,涉
2、及到数据库、人工智能、数理统计、可视化、并行计算等领域"】。分类是数据挖掘的一个重要内容1561,它通过构造一个分类函数或分类模型(也常称作分类器),把数据库中的数据项映射到给定类别中的某一个,从而能够使用该模型来预测类标号未知的对象类。在众多的分类方法中,贝叶斯分类以其简单的结构和良好的性能而备受关注。与其它分类方法不同,贝时斯分类建立在坚实的数理统计知识基础之上,基于求解后验概率的贝叶斯定理.理论上讲它在满足其限定条件下是最优的。蒙特卡罗是~种采用统计抽样理论近似求解数学或物理问题的方法,它在用于解决贝叶斯分类时
3、。首先根据已知的先验概率获得各个类标号未知类的条件概率分布,然后利用某种抽样器,分别得到满足这些条件分布的随机数据,最后统计这些随机数据,就可以得到各个类标号未知类的后验概率分布。运行一个特定的马尔可夫链口1J.--f以容易地获得满足某个特定分布的随机抽样l州,所以马尔可夫链蒙特卡罗(MCMC)是最常用的蒙特卡罗贝叶斯分类方法【l81。McMC可以减少数据挖掘中的时间和空间开销.但对于巨型数据集,MCMC在计算方面也不切实际130I。本文通过改进MCMC算法,使它能够用于巨型数据集的挖掘。该算法对数据集进行划分,改变
4、MCMC对数据集的扫描策略,将其分开为内、外两个循环过程,外循环中扫描数据集.内循环扫描分布函数的抽样值。另外。本文还评估了抽样效率和有效抽样容量等问题,使用了极小量过滤方法,进一步增强了对巨型数据集的数据挖掘的实际操作能力。主题词:数据挖掘;知识发现;贝叶斯分类:蒙特卡罗方法硕士学位论文MASI'ER’SIIIESISAbstractWjnlthedevelopmentofinformationtechnologyanddatabases’wideuse.moreandmoreinformationisaccumu
5、lated,andhowtofindoutinterestingknowledgefromitisaseriousproblemofoursociety.Technolegyofknowledgediscoveryemergeastimesrequire,andbecomeoneofthehotresearchprojects.KDD(Knowledgediscoveryindatabases)Canfindouttheeffective,novel,latent,andapprehensibleinformatio
6、n.DataminingisthekeystepofKDD,whichconcernsondatabase,artificialintelligence,andstatistics,etc.Classificationistheimportantcontentofdatamining,whichassignsdataitemsindatabasestoaspecialclassbyconstructingaclassificationfunctionormodel(alsobecalledclassifier).Th
7、erefore,wecanpredicttheunlabelledobjectclasseswiththeclassificationmodel.Unlikeotherclassifications,Bayesianclassificationbasesonmathematicsandstatistics,anditsfoundationisBayesiantheory,whichanswerstheposteriorprobability.Theoreticallyspeaking,itwouldbethebest
8、solutionwhenitslimitationiSsatisfied.MonteCarloisamethodthatapproximatelysolvesmathematicorphysicalproblemsbystatisticalsamplingtheory.WhencomestoBayesianclassification,itfi
此文档下载收益归作者所有