欢迎来到天天文库
浏览记录
ID:24842815
大小:889.18 KB
页数:16页
时间:2018-11-16
《银行客户满意度分析论》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、浙江大学宁波理工学院数据挖掘竞赛论文报告浙江大学宁波理工学院银行服务客户满意度分析综合评定成绩:评委评语:评委签名:15/16浙江大学宁波理工学院数据挖掘竞赛论文报告银行服务客户满意度分析摘要:随着全球银行业市场竞争的日趋激烈,提升客户的满意度,培养忠诚客户已成为各大商业银行开拓市场,增加盈利的重要手段之一。通过数据挖掘技术对客户满意度进行分析已成为研究热点。桑坦德银行(SantanderBank)是欧洲第二大银行,他们提供了一个数据集要求通过数据挖掘技术在早期就能识别对其服务不满意的客户,以便及时采取合适的改进措施
2、以提升客户的体验。关键词:数据挖掘技术顾客满意度PCA主成分分析法决策树预测15/16浙江大学宁波理工学院数据挖掘竞赛论文报告ThethesistitleAbstract:AbriefdescriptionoftheabstractKeywords:Thekeywordextraction15/16浙江大学宁波理工学院数据挖掘竞赛论文报告目录1.研究目标62.分析方法与过程62.1.总体流程62.2.具体步骤62.3.结果分析73.结论74.参考文献715/16浙江大学宁波理工学院数据挖掘竞赛论文报告1.挖掘目标(1
3、)背景:随着全球银行业市场竞争的日趋激烈,提升客户的满意度,培养忠诚客户已成为各大商业银行开拓市场,增加盈利的重要手段之一。通过数据挖掘技术对客户满意度进行分析已成为研究热点。桑坦德银行(SantanderBank)是欧洲第二大银行,他们提供了一个数据集要求通过数据挖掘技术在早期就能识别对其服务不满意的客户,以便及时采取合适的改进措施以提升客户的体验。在本次竞赛中,参赛者需要通过分析匿名用户的上百个特征来预测用户对其银行服务的满意程度(满意或不满意)。在数据集中ID表示客户的匿名ID,TARGET是需要预测的变量,1
4、表示不满意,0表示满意,剩余的列是已提取的跟客户满意度相关的观测指标(属性);需求:1、分析哪些特征或特征组合能较好的对银行服务满意程度进行分析;2、建立合适的银行服务客户满意度模型;3、预测在测试集中每个客户的满意程度(属于不满意客户的概率);4、建立合适的评价指标,验证你的预测结果。说明:附件共分三个文件:Train.csv中是训练数据,其中包含预测量TARGET,Test.csv是测试数据,只包含属性数据。Sample_submission.csv是需要与源代码一起上传的最后结果样式,要求输出对Test.csv
5、的测试结果。(2)目标:本次数据挖掘建模要达到的目标是利用银行关于客户信息建立下来的数据,采用数据挖掘技术,进行已知数据以及结果的相关分析测试找到规律建立模型,之后利用测试数据带入模型进行预测得到你结果。题目给出的大数据的属性以及维度都比较大,所以会有一些冗余和无效数据,首先要先将高维大数据进行预处理,利用weka的元学习器,通过与NativeBayes方法一起使用,测试软件自带的属性选择方法,选择15/16浙江大学宁波理工学院数据挖掘竞赛论文报告得到一些最具影响力的属性进行作为训练子集,并且运用进算法里面。这个方法
6、可以将数据进行降维,保留相应比较主要的影响因素属性。随后将数据和人属性一起放入决策树分类算法,建立合理的模型,可以找到不同属性对目标决定影响程度,建立完成比较合理的分类系统。随后将题目给出的测试数据放入模型,利用已知的模型进行预测,可以推算出客户满意情况,银行可以对于这个预测结果对相应用户可以提早对其采取相应措施。1.分析方法与过程1.1.总体流程2.1.1问题12.1.2问题2、3、4原始数据建模&预测0结果&评估数据预处理数据筛选1.2.具体步骤15/16浙江大学宁波理工学院数据挖掘竞赛论文报告2.2.1解问题1
7、将excel数据进行转化得weka可以识别的csv格式,利用weka的另存功能得到arff格式,这个过程得到的数据还是不能直接进入决策树运用的。需要打开arff格式的数据,将数据类别的一栏修改为银行需要的0、1满意度类别,将数据加载计入决策树可以得到一个枝节繁茂的树,由此可以从这棵树的模型之中得到影响因素中最大的特征或特征组合为根节点以及靠近根节点的几个特征。使用wake通过决策树J48算法,验证训练集,结果如图:图115/16浙江大学宁波理工学院数据挖掘竞赛论文报告图22.2.2解问题2、3、4本用例主要包括如下步
8、骤:步骤1:数据筛选&数据预处理从原始数据分析得到,题目给出的原始数据属性太多,并且都是未知属性,此外表格的大部门数据值为0,面对这个训练集,里面特征很多是和类标签有关的,但里面存在噪声或者冗余。在这种情况下,需要一种特征降维的方法来减少特征数,减少噪音和冗余,减少过度拟合的可能性。所以我们利用weka深入研究自动属性选择,它允许指定属性选择方
此文档下载收益归作者所有