欢迎来到天天文库
浏览记录
ID:27563741
大小:738.08 KB
页数:10页
时间:2018-12-04
《weka使用报告》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、WEKA使用实验报告一、实验目的数据挖掘是通过分析存在于数据库里的数据来解决问题。在数据挖掘中计算机以电子化的形式存储数据,并且能自动的斉询数据,通过关联规则、分类与回归、聚类分析等算法对数据进行一系列的处理,寻找和描述数据里的结构模式,进而挖掘出潜在有用的信息。WEKA是一种开源的数据挖掘工具。WEKA的全名是怀卡托智能分析环境(WaikatoEnvironmentforKnowledgeAnalysis),是一款免费的,非商业化的数据挖掘工具,其源代码可从(http://www.es.waikato.ac.nz./ml/weka/)得
2、到,我们在本次实验中所使用到的相关数据,也是从该处获得的。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,括对数据进行预处理,分类,回归,聚类,关联规则以及在新的交互式界面上的可视化。本次试验,我们要通过学习WEKA工具的使用,与上课内容相结合,针对某些数据挖掘算法建立起数据挖掘模型,进而对数据分析技术有更深层次的丫解。二、实验准备在启动WEKA时,会弹出GUI选择器,选择使用WEKA和数据的四种方式。如下图所示:visualizationJoolsHelpWEKATheUniversityolWaik
3、atoKpplicaliontoWekjGUExplorertaiAat*f«rZ*c*2esetAnalrsitVersice3.€•11SiapleCLI(d19W-20HTE4、量,右下方还给出一些可视化效果图。这些都是比较直观的分析,如果想发现隐藏在数据集背后的关系,还需耍选择WEKA提供的各种分类、聚类或关联规则的算法。界面如下图所示:OWekaExplorerClMtifyCl«st«rMsvcialt!SelectIViOpenUSL0p«&DBOpenfileJLEixtStveFilterCkett*Ke»a»alT•BinaryCvr»trelationRelation.st0«*ntIiuttAc••:1500AttributesAUnbvttt20•ttnVuttV«it鼸0©I)Iyp«SuB5、tricUbi6、可以查看该训练集中的数据,如下图所示:三、实验内容1.贝叶斯算法点“Choose”按钮选择“bayes”,这是WEKA中实现的贝叶斯算法。选择Cross-Validatioinfolds=10:然后点击“start”按钮,就可以生成贝叶斯模型并丑该模型的误差分析结果出现在右边“Classifieroutput”屮。下图是本例中训练数据集的误差分析结果:=Runinformation==Scheme:weJca•classifiers.bayes.NaiveBayesRelation:segmentInstances:1500Attribu7、tes:20rcgion-centroid-colregion-centroid-rowregion-pixel-countshort-line-den3ity-5short-line-den3ity-2vedge-meanvegde-sdhedge-meanhedge-sdintensity-meanrawrea-irieanrawblue-ireanrawgreen-sieanexred-meanexblue-meanexgreen-irjeanvalue-meansaturation-meanhue-meanclassTestmod8、e:10-foldcross-validation=Classifiermodel(fulltrainingset)==Naive3ayesClassifierCla33Attributebr
4、量,右下方还给出一些可视化效果图。这些都是比较直观的分析,如果想发现隐藏在数据集背后的关系,还需耍选择WEKA提供的各种分类、聚类或关联规则的算法。界面如下图所示:OWekaExplorerClMtifyCl«st«rMsvcialt!SelectIViOpenUSL0p«&DBOpenfileJLEixtStveFilterCkett*Ke»a»alT•BinaryCvr»trelationRelation.st0«*ntIiuttAc••:1500AttributesAUnbvttt20•ttnVuttV«it鼸0©I)Iyp«SuB
5、tricUbi
6、可以查看该训练集中的数据,如下图所示:三、实验内容1.贝叶斯算法点“Choose”按钮选择“bayes”,这是WEKA中实现的贝叶斯算法。选择Cross-Validatioinfolds=10:然后点击“start”按钮,就可以生成贝叶斯模型并丑该模型的误差分析结果出现在右边“Classifieroutput”屮。下图是本例中训练数据集的误差分析结果:=Runinformation==Scheme:weJca•classifiers.bayes.NaiveBayesRelation:segmentInstances:1500Attribu
7、tes:20rcgion-centroid-colregion-centroid-rowregion-pixel-countshort-line-den3ity-5short-line-den3ity-2vedge-meanvegde-sdhedge-meanhedge-sdintensity-meanrawrea-irieanrawblue-ireanrawgreen-sieanexred-meanexblue-meanexgreen-irjeanvalue-meansaturation-meanhue-meanclassTestmod
8、e:10-foldcross-validation=Classifiermodel(fulltrainingset)==Naive3ayesClassifierCla33Attributebr
此文档下载收益归作者所有