数据挖掘实验报告-实验1-weka基础操作

数据挖掘实验报告-实验1-weka基础操作

ID:23144570

大小:681.53 KB

页数:13页

时间:2018-11-04

数据挖掘实验报告-实验1-weka基础操作_第1页
数据挖掘实验报告-实验1-weka基础操作_第2页
数据挖掘实验报告-实验1-weka基础操作_第3页
数据挖掘实验报告-实验1-weka基础操作_第4页
数据挖掘实验报告-实验1-weka基础操作_第5页
资源描述:

《数据挖掘实验报告-实验1-weka基础操作》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、学生实验报告学院:信息管理学院课程名称:数据挖掘教学班级:B01姓名:学号:实验报告课程名称数据挖掘教学班级B01指导老师学号姓名行政班级实验项S实验一:Weka的基本操作组员名单独立完成实验类型■操作性实验□验证性实验□综合性实验实验地点11535实验口期2016.09.281.实验目的和要求:(1)Explorer界面的各项功能;注意不能与课件上的截图相同,可采用打开不同的数据文件以示区别。(2)Weka的两种数据表格编辑文件方式下的功能介绍;①Explorer-Preprocess-edit,弹出Viewer对话

2、框;②WekaGUI选择器窗口-Tools

3、ArffViewer,打开ARFF-Viewer窗口。(3)ARFF文件组成。2.实验过程(记录实验步骤、分析实验结果)2.1Explorer界面的各项功能2.1.1初始界面示意•罾ekaGUIChooserB回®Prop-amYisualiration£oolsU«lpApplicationsExplorer•VEKA[TheUniversityofWaikatoExp«riB«nltrTaxkatofAvircnx«ntforA.kItbxiVcrsicaS.7.13(e

4、)1999-2015TheVnxvtrsxtrciTaxkateHaxilton*K«ZealandKn»vl«dc«Flow其中:explorer选项是数据挖掘梳理数据S常用界面,也是使用wekaS简中.的方法。Experimenter:实验者选项,提供不同数值的比较,发现其屮规律。KnowledgeFlow:知识流,其屮包含处理大型数裾的方法,初学者应用较少。SimpleCLI:命令行窗口,有点像cmd格式,非图形界而。2.1.2进入Explorer界面功能介绍(1)任务面板Preprocess(数据预处理):选择

5、和修改要处理的数据。Classify(分类):训练和测试分类或回归模型。Cluster(聚类):从数据屮聚类。聚类分析时用的较多。Associate(关联分析):从数据中学习关联规则。SelectAttributes(选择属性):选择数据屮最相关的属性。Visualize(可视化):查看数据的二维散布阁。(2)常用按钮Openfile:打开文件OpenURL:打开URL格式文件OpenDB:打开数据库文件Generate:数据也成Undo:撤销操作Edit:编辑数据Save:保存数据文件,可实现文件格式的转换,比如cs

6、v格式文件向A.RFF格式文件转换等等。(3)筛选数据Choose:从这个按钮进去可以选择某个过滤器对数据进行筛选,数据预处理一般使用这个。Apply:处理完成后,点击这个按钮,处理生效。(4)数据集的属性关系和操作currentrelation:展示了属性的(relation)关系名称,(attributes)属性数,(Insetances)实例数,(sumofweights)权重的总和等多种属性关系。AUributes:展示了属性的所有列,上边的四个按钮是对属性歹⑽快捷选择按钮,包括(all)全选,(none)全不

7、选,(Iverl)反选,(patern)模式;,选择符合某一条件的属性列。最下边的remove按钮可以删除选中的属性列,如果想撤回,可以使用上边提到的undo按钮〜(3)属性摘要和直方图Selectedattributes:如果是数值属性:属性名(Name)、属性类型(Type)、缺失值(Missing)个数及百分比、不同值(Distinct)数、唯一值(Unique)数及百分比等等。对于数伉属性和标称属性,摘要的方式是不一样的。阁屮显示的是标签的取值及相应取伉的实例数。选中属性的直方图。若数据集的最后一个属性是类标变

8、量(这是分类或回归任务的默认目标变量,如“play”),直方图中的每个长方形就会按照该变量的比例分成不同颜色的段。要想换个分段的依据,在上方的下拉框巾选个不同的分类属性就可以了。下拉框里选上“NoClass”或者一个数值属性会变成黑白的直方图。Visualize:展示所有的属性的直方图(4)状态栏(status)0*•裊fal*filterdbo•霣relatiMiOresuvxI4atSaveKtl.tioaXBStMbCWt1S00Attrikste*AllAltrikvtetXFett«r«Itjr

9、ic■>■■■■•胃界呀rdo*I■aiimi籠in!•?n229C1m»«!<••v••山“aHSelwt«JattriWr*j[Mb•“汽4StatusOK10ni:l)IX<2MU«•“I显示一些信息让你知道正在做什么。在状态栏中的任意位置右击鼠标将会出现一个小菜单。有两个选项:MemoryInformation-

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。