欢迎来到天天文库
浏览记录
ID:44917215
大小:434.80 KB
页数:6页
时间:2019-11-05
《基于决策树的保险客户流失分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、万方数据第26卷第8期计算机工程与设计2005年8月V01.26No.8ComputerEngineeringandDesignAug.2005基于决策树的保险客户流失分析桂现才1’2,彭宏2,王小华3(1.湛江师范学院数学与计算科学学院,广东湛江524048;2.华南理工大学计算机科学与工程学院,广州510641;3.中国平安人寿保险公司湛江中心支公司,广东湛江524022)摘要:保持客户和吸引客户是保险公司提高竞争力的关键,目前保险公司对客户流失的分析是粗略的或根据经验来判断。利用面向属性归纳和决策树C4.5算法对保险客户基本信息进行分析,找出客
2、户流失的特征,能帮助保险公司有针对性地改善客户关系。关键词:客户流失分析;保险;数据挖掘;决策树;面向属性归纳中图法分类号:TP311.131文献标识码:A文章编号:1000.7024(2005)08—2026-04Customerchumanalysisininsurancebasedondecision仃eesGUIXian.cail,一,PENGHon92,WANGXiao.hua3(1.SchoolofMathematicsandComputation,ZhanjiangNormalCollege,Zhanjiang524048,China;
3、2.CollegeofComputerScienceandEngineering,SouthChinaUniversityofTechnology,Guangzhou510641,China;3.ZhanjiangKeyBranch,Ping’anLifeInsuranceCompanyofChinaLtd,Zhanjiang524022,China)Abstract:Holdingandattractingcustomeristhekeytoraisecompetitivecapabilityofinsurancecompany.Now,inmos
4、tinsurancecompaniesthecustomerchumanalysisisquiteroughandevenjudgedbyexperience.Attribute-orientedinductionanddecisiontrees(C4.5algorithm)wereappliedtoanalyzeinsurancecustomerdatabaseandfindthecharacteristicsofcustomerchum,helpinginsurancecompanytoimprovetherelationswiththecust
5、omer.Keywords:customerchumanalysis;insurance;datamining;decisiontrees;attribute—orientedinduction1引言随着我国加入WTO后,我国保险市场将逐步对外开放,保险市场的竞争将更加激烈。客户是保险公司生存和发展的根基,而吸引客户、保持客户、避免客户流失是保险公司提高竞争力的关键。数据挖掘在保险领域有着广泛的应用,通过挖掘,可发现购买某一保险险种的客户的特征,从而可以向那些具有同样特征却没有购买该保险险种的客户进行推销;还可找到流失客户的特征,在那些具有相似特征的
6、客户还未流失之前,采取针对性的措施避免客户的流失。该文利用面向属性归纳和分类决策树C4.5算法,对保险公司的客户基本信息进行分析,找出了客户流失的特征,可帮助保险公司有针对性地改善客户关系,避免客户流失。2数据挖掘的方法和决策树挖掘步骤数据挖掘就是从大量的数据中,抽取出有效的、新颖的、潜在有用的,以及最终可理解的知识、模型或规则的过程。数据挖掘分析方法大致包括关联规则、分类、聚类、序列模式等“1。关联规则的目的是希望在事务数据库中发现经常共同出现的项目,推断隐藏在项目之间的相互关联的规则。分类是按照一组数据对象的特征给出其划分的过程,要求有己知分类的
7、样本数据作为训练集,经过对训练集的学习得到关于分类的规律,从而对新数据进行分类。聚类是利用聚类技术识别一组数据对象的内在规则,将对象聚合成相似的类,以导出数据的分布规律。聚类与分类的差别在于它不需要训练样本,是一种无监督的学习。序列模式的目的也是为了挖掘数据之间的联系,但它主要关注于分析挖掘和时间顺序相关的模式。利用决策树方法进行数据挖掘一般有如下步骤:数据预处理、决策树挖掘操作、模式评估和应用。3数据预处理数据挖掘的处理对象是大量的数据,这些数据一般存储在数据库系统中,是长期积累的结果。但往往不适合直接挖掘,需要做数据的预处理工作,一般包括数据的选
8、择(选择相关的数据)、净化(消除冗余数据)、转换、归约等。如果挖掘的对象是数据仓库,那么这些工作往往在生成数
此文档下载收益归作者所有