资源描述:
《实验二数据挖掘的实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实验二数据挖掘的实现(2学时,设计型)学院计算机科学学院专业年级信管2012姓名学号实验课程名称数据仓库与数据挖掘技术成绩实验项目名称数据挖掘实现指导老师方宇一、实验目的(1)了解XLMiner的安装方法;(2)熟悉掌握在XLMiner中数据可视化操作(盒图、直方图、散点图等)(3)熟练掌握在XLMiner数据预划分的操作;(4)熟练掌握XLMiner数据预处理的操作(数据抽样、缺失值处理等);(5)熟悉各种数据挖掘的方法(关联规则生成);(6)读懂挖掘报告含义。二、实验内容及原理实验01安装XLMiner以及在Excel中的配置。实验02了
2、解XLMiner概况,熟悉XLMiner主界面,了解各种功能及数据的支持类型和使用范围。实验03使用图标中的盒图功能分析、展示数据。实验04使用图标中的直方图功能分析、展示数据。实验05使用图标中的散点图功能分析、展示数据。实验06使用数据功能中的数据分段功能(Excel文档)。实验07使用数据功能中的数据抽样和缺失值处理功能(Excel文档)。实验08使用数据功能中的分箱处理连续值功能。实验09使用关联规则工具生成关联规则集,分析关联规则集中规则的含义。三、使用仪器、器材微机一台操作系统:WinXP编程软件:MicrosoftOfficeE
3、xcel2007及以上版本+XLMiner3.2.6试用版(15天)四、实验步骤实验01(1)双击XLMiner3.2.6进行安装。(1)一路下一步直到安装完成自动打开Excel。(2)点击文件选项卡,在“帮助”列中打开“选项”à“信任中心”à“加载项”去掉所有勾。(3)打开“选项”à“加载项”查看“禁用的应用程序加载项”中有没有XLMiner3,如有点击设定为“活动应用程序加载项”直到在该列表中看到XLMiner3,如图所示:实验02(1)启动Excel“加载项”选项卡,如图所示。(2)查看XLMiner中各种功能。支持的功能如下图表数据分
4、割Standardpartition,PartitionwithOversampling数据工具Samplefromworksheet,Samplefromdatabase(ExceptinEducationedition),Missingdatahandling,Bincontinuousdata,Transformcategoricaldata时间序列Partitioning,ARIMA,ACF(Autocorrelations),PACF(PartialAutocorrelations),Smoothing分类Discriminanta
5、nalysis,logisticregression,classificationtree,naïveBayes,neuralnetworks(multilayerfeedforward)andk-nearestneighbors预测Multiplelinearregression,regressiontree,neuralnetworks(multilayerfeedforward)andk-nearestneighbors关系Associationrules数据分析及规约Principalcomponentanalysis,Hierarc
6、hicalclustering,andk-meansclustering数据可视化Boxplot,Histogram,Matrixplot(1)查看该软件算法及数据类型支持。实验03Figure1盒图示例(1)打开“(Boxplot).xls”文件如下图所示。(2)单击“Charts”选项“Boxplot”。设定参数如下图。(1)点击OK,生成如下盒图。计算通过公式能计算mean,Q1,Q2usingformulas.Mean=23.66Q1=10.49Q3=37.71Cutoff1=10.49-1.5*(37.71-10.49)=-30.3
7、4请计算Max是多少,列出离群点是那些数据验证是否同盒图绘制的情况一致注:52,57,60,63,71,72,73,76,98,110,120盒图中各数值计算方式Median=721=61.5Q3=87Mean=77.45InterquartileRange=Q3-Q1Min=Q1-1.5*(Q3-Q1)Max=Q3+1.5*(Q3-Q1)(1)设定参数如下图所示:(2)读取Y2的盒图,计算验证Q1,Q2,Min,Max,Mean值是多少。实验04(1)打开“BostonHousing.xls”文件。(2)选择“Charts”à“Histog
8、ram”,设定参数如下图所示:(8)单击“OK”输出如下图:(9)分析该图所展示的内容:值域是多少,横坐标是什么意思,分为几段?实验05(1)打开“BostonHo