欢迎来到天天文库
浏览记录
ID:43876282
大小:446.47 KB
页数:19页
时间:2019-10-16
《数据挖掘实验报告-数据挖掘的基本数据分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、《数据挖掘与应用》实验报告6到11章自动化专业物联网工程年级班别2015物联网4班学号3115001492董延峰学生姓名张思明指导教师实验6数据挖掘的基本数据分析一、实验目的(1)熟悉基本数据分析的处理流程(2)进一步熟练掌握SPSSModeler工具的操作二、实验环境(1)相关智能算法的基本原理(2)IBMSPSSModeler软件三、实验内容及步骤1、数据的质量探索(1)建立数据流a、创建"Statistics”节点,读入telco.sav数据。b、创建“类型”节点,说明各变量角色,其中“流失”为目标变量。c、创建“数据审核”节点并连接在适当的位置,进入编辑界面,在“质量”选项卡下
2、,选择检测方法为平均值的标准差。(2)结果输出雨核fit注解2£件(巳◎生IR©』号jll•術多方式U*示采件缩112、基本描述分析(1)建立数据流,创建“统计量"节点。(2)设置相关参数a.设置“统计量”节点,在“检查”屮添加开通月数、基本费用、免费部分和无线费用。b、在“相关”中添加年龄、收入和家庭人数。c、在“相关选择”中选择“按重要性定义相关强度”。(3)结果^12SJ]3文件(E)l3偏辑(E)O生咸@)绒计信息
3、
4、注解[g全fiMfr愛(C)]全部展禾司日开通月教SStatistics计数1000平均值35.526最小值1.000最大值72.000范国71.000方差456
5、.242标121.360平均值标淮误差0.675HPearson相关性0.4900.243城庭入埶•0.0373基本费用E)Statistics计敎1000平均值11.723最小佰0.900最大值99.950范遛99.050方差107.402标進差10.363平均值标淮误差0.328QPearson相天性0401家庭人敎0.195•0.036诵走3、绘制散点图(1)构建数据流,创建“图”节点。(2)设置参数a、编辑“图”节点b、在“X字段”和“Y字段”中分别选择“基木费用”和“年龄将“交叉字段”中的“颜色”设置为“流失”,不同颜色表示流失变量不同取值的样本点。(3)结果输出z偏辑(fi
6、)O生咸(£)&WS(Y)呈Li□XLOjxJ回s$»「文件(E)图形注解4、两分类变量相关性的研究(1)设置相关参数。创建“网络”节点,在“字段”中选择“套餐类型”和“流失”,设置线值为“绝对值”。(2)结果输!11刚首芽益•「夕::的网状图-□X*£0/觀三0
7、屈»JolxJK1图形连解3.0000004000000<•2.000000*/JBI.OOOOOO .0000001.000000O诫失•务資贡勺@1■£1•1•111111•11•1•1•1•1•J•0204000801001201401OO180200220240WMKZ—I1你乡1「■■■・*w^nH?rr•定5、
8、变量重要性分析(1)窗口设置。创建“特征选择”节点,编辑,将“流失”添加到目标选项中,其他的全部作为输入。(2)结果输出©舷X值序么字段开通月数2®戛本费用⑥年龄4®电子支付5<&敎肓水平6®套餐类型7®无线服务8无线贵用9®收入_10®免费部分门®姐姻状;兄12®家庭人数13®居住地14®性别续续续义序义义续续续义续义义连连连名有名名连连连名连名名Z纟京夕纟夕玄选走审段数:10可用亨段总数:14总的图:SxnStatistics訓要SB要飪要要要要要要要要要要重1重羣1GEGEUUI曾.HrBEGE亘亘FFFFa333fl333fl3S3a333PVPVPVfV1.01.0二1
9、.0二1.0二1.0二1.0二1.0二0.9980.9960.9960.7790.2440.1840.151E>0.95田<=0.950<0.90筛选的字段测里原因Telephonesav流失套餐类型x流尖15字段基本费用V.年龄实验7统计分析:逻辑回归一、实验日的SPSSModeler的Logistic回归的方法。(1)了解和熟悉SPSSModeler及其相关知识。(2)掌握SPSSModeler工具建立多项Logistic回归的方法。(3)学会运用SPSSModeler进行多项Logistic回归的内容。二、实验环境一台装有SPSSModeler软件系统的计算机。三、实验内容及步骤
10、1、构建多项Logistic回归数据流(1)通过uStatistics文件”节点读入Brand.sav0(2)数据流中添加“类型”节点。(3)在"建模”模块下选择“Logistic”节点连接在数据流中恰当的位置。(4)运行结果:0X3X■文件(E)3W8(fi)Q生咸(G)+播入(1)_)格式[»槪邑I直❼&E/'描要鬲级设贵注解:丄<」&全部折挞©隔全却展开(£)曰方程式用于1•02319・(X1=2]・0.7474*p(2=1]*♦-0.6
此文档下载收益归作者所有