欢迎来到天天文库
浏览记录
ID:21319199
大小:755.50 KB
页数:19页
时间:2018-10-21
《姚丹妮商务智能化课设报告》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、《商务智能》课程设计报告班级:信管131学号:3130561025姓名:姚丹妮同组人:赵咪杨乔指导教师:王建仁/李明日期:2016.01.04--2016.01.08目录1.需求分析32.数据理解33.挖掘(或分析)数据准备44.数据挖掘(或分析)过程54.1挖掘算法与挖掘软件选择54.2数据预处理54.3挖掘过程说明65.结果展示与评价186.总结196.1设计中遇到的主要问题及解决方法196.2设计方案的主要优点及不足196.3收获及建议19参考文献19连锁酒店顾客信用度分析方案设计1.需求分析一个连锁酒店的经营与不同客户息息相关。酒店不仅需要每天面对不同
2、的新增客户,也需要维系老客户。所以对于已消费的顾客的信用度的分析尤为重要。不同顾客信用度之间存在诸多差异。好坏之分也影响了酒店的经营状况。一个信用度良好的客户对于酒店来说是好事,但如果一个顾客信用度底下,则极有可能出现拖欠房费等状况,这会严重损坏酒店利益。因此我会采用分类分析的方法。利用决策树模型构建顾客信用度分析体系,并进行相关预测,以便于酒店日后的经营以及对顾客的服务,对于那些信用度良好的顾客可以给予一定优惠,而对于那些信用度较差的顾客,则要避免在酒店再次进行消费而又不付款的情况。2.数据理解为建立决策树,需要事先建立数据挖掘所需数据库或数据表,即顾客信用
3、数据表。将顾客相关信用度的信息输入表中,以便分析。输入的信息均具有代表性。不重复不冗余,如若不然,可再进行数据预处理。所需数据如下图所示:3.挖掘(或分析)数据准备首先需要在数据库中建立“数据挖掘实验“数据库,并在数据库中建立表“顾客信用数据表1”(1)设计“顾客信用数据表1”,表结构如下图所示:设置“顾客编号”为主键。(2)编辑表的前200行,输入表中信息。(注意输入的信息一定要具有代表性,避免冗余与重复)4.数据挖掘(或分析)过程4.1挖掘算法与挖掘软件选择算法:分类分析算法(决策树)软件:microsoftvisualstudio20084.2数据预处理
4、由于表“顾客信用数据表1”中的数据存在冗余缺失等问题,所以需要对表中数据进行数值化处理,离散化处理等相应的预处理操作,并将预处理之后的信息存入新表“顾客信用数据表2”中。具体步骤如下所示:(1)将年龄属性列的数据进行离散化处理,设置区域范围,分别为<30、<50、>=50三个范围,并将表中“年龄”属性列中的信息按照其对应的范围进行修改,以便于决策树的生成(2)将年收入属性列的数据进行归一化处理,将每个数据值除以100000,缩小数据,以便观察。(同时要修改表中“年收入”属性列的数据类型,由int改为float)(3)将信用等级属性列进行数值化处理,等级“A/B
5、/C/D/E”分别对应“1/2/3/4/5”,将表中“信用等级”属性列中的信息按照其对应的数值进行修改,以便于决策树的生成预处理之后的表的结构及内容如下图所示:表结构:表中具体内容:4.3挖掘过程说明(1)打开挖掘软件,点击“新建”,建立“顾客信用分析”的挖掘项目。(2)定义数据源。在页面右方点击新建“数据源”,点击“下一步”。将服务器名改为“localhost”,选择使用windows身份验证,选择“数据挖掘实验”数据库。点击“下一步”。选择“使用服务账户”,点击“下一步”。然后完成。(3)定义数据源视图。在页面右方点击新建“数据源视图”,点击“下一步”。选
6、择“数据挖掘实验”,点击“下一步”。选择“与主键同名”,点击“下一步”。选择“顾客信用数据表2”(已经进行过数据预处理的表),点击“下一步”。然后完成。(4)创建挖掘结构。在页面右方点击新建“挖掘结构”,点击“下一步”。选择“从现在关系数据库或数据仓库”,点击“下一步”。选择“决策树”类型,点击“下一步”。点击“下一步”。点击“下一步”如下所示,顾客编号为主键,年龄、年收入、信用等级、性别、职业为可输入,信用等级为可预测。点击“下一步”。设置“测试数据百分比”,点击“下一步”。点击“完成。定义数据源,数据源视图,新建挖掘结构以后,如下图所示。(5)设置相关参数
7、。右键点击“设置算法参数”(选择不同的算法参数会带来不同的决策树模型)参数设置如下图所示,可根据自己的需求设置不同参数。(6)进行部署,实施挖掘。点击“运行”,进入下一步。处理完成,可以到主界面查看挖掘模型。5.结果展示与评价决策树模型如下图所示:依赖关系如下所示:由上边所生成的决策树可知,信用等级与年龄、职业、性别和年收入都具有相辅相成的关系。其中依赖关系最强的是年龄和年收入。根据“数据挖掘实验”数据库中的信息,所生成的决策树显示,当年收入>=1.178并且<1.472,职业不为销售员的顾客信用程度相对较高。而职业为销售员且年龄小于30岁的人信用程度则是中等
8、偏下。其他则分布不均。6.总结6.1设
此文档下载收益归作者所有