基于统计的分类算法与其在潜在客户识别中的应用.研究

基于统计的分类算法与其在潜在客户识别中的应用.研究

ID:31981896

大小:2.42 MB

页数:61页

时间:2019-01-30

基于统计的分类算法与其在潜在客户识别中的应用.研究_第1页
基于统计的分类算法与其在潜在客户识别中的应用.研究_第2页
基于统计的分类算法与其在潜在客户识别中的应用.研究_第3页
基于统计的分类算法与其在潜在客户识别中的应用.研究_第4页
基于统计的分类算法与其在潜在客户识别中的应用.研究_第5页
资源描述:

《基于统计的分类算法与其在潜在客户识别中的应用.研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:日期:j·竹年0月《日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入

2、有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密口,在——年解密后适用本授权书。2、不保密团。(请在以上相应方框内打“4”)日期:;”.}年。月jf日日期:劲降r月矿日畅节磷‰名名签签者师作导硕士学位论文第1章绪论1.1潜在客户识别概述1.1.1研究背景商务领域的数据多以数值化的形式表示。随着计算机技术的发展,六十年代人们开始了对此领域数据的研究并经历了一个较长的发展过程。从六十年代以数据收集为重点发展到八十年代着重于数据检索的研究,再到九十年代数据挖掘技术的兴起,反映出人们对数据理解的

3、逐步深入和对知识获取的需求。在商务领域中,多种因素的共同作用增加了客户关系的复杂性。而面对激烈的竞争格局,如何以有效的方式最大可能的获取客户从而保证自身竞争力是决策者重点关注的问题。中国加入WT0后,外资保险将在五年之内占据我国30%的市场份额,外资保险将利用IT技术提供更深层次的服务及更先进的产品,并通过包括网上保险在内的优秀分销体系来覆盖整个市场。国内保险人才流失的同时,国内保险企业还将失去部分有影响的主要客户。在对中国保险业加入WT0屠的竞争格局进行了宏观的分析后,IBM认为,国内保险市场的竞争状态主要表现在保险商对企业和最有利客

4、户的激烈争夺上“1。但从数据中随意的选择或简单的检索。并不是有效获取潜在客户的方式。因此期望采用挖掘技术从数据库中自动地发现相关模式来预测客户的类别。1.1.2研究意义数据挖掘12】是多学科交叉的计算机应用技术,在金融领域得到广泛应用“1。因为市场的竞争主要是对企业和最有利客户的激烈争夺。所以将客户信息进行分类后提取潜在客户信息用于辅助决策有重要的现实意义。因为没有任何一种分类算法能适合所有数据,也没有任何一种分类算法从本质上优于其它分类算法,所以在实际应用中需要根据研究对象的数据特征来选择适合的算法并迸行改进。因此分类算法有较强的研究

5、意义。选择本课题作为研究对象主要基于下述三点考虑:1.研究的可能性:计算机硬件和应用技术的高速发展为研究提供了所需的研究数据,而数据挖掘技术和统计学等学科知识的发展和完善为研究提供了可供选择的分类算法。2.研究的必要性:潜在客户识别是客户关系管理(CRM)系统的重要组成部分,基于统计的分类算法及其在潜在客户识别中的应用研究而CRM是一种“以客户为中心”的先进经营管理理念,能够实现通过客户利益的最大满足促进企业利润极大增长的经营目标。数据挖掘作为一种先进的数据分析方法,是实现对客户数据进行深入分析的有效工具,是帮助企业实现既定目标的最佳途

6、径。所以在竞争日益激烈的当今社会,这种研究是必要的。3.研究的可行性:现实世界中,因主观因素影响使客户在具有相同的客户特征时,产生不同的购买行为,因此当客户信息以数据的形式表达时,表现为:数据元各条件属性取值相同,而类标识属性取值不同。致使数据的不一致,数据的不一致又被称为数据矛盾。经典的数据挖掘算法在建立数学模型时对上述情况造成的影响考虑不够,因此常规算法建立的数学模型与实际问题闾有一定的模型误差,从而使模型精度不高。又因分类是实现从数据元条件属性到数据元决策属性的映射,所以本文将对条件属性的研究作为重点,通过选择合适的算法并进行改进

7、来提高模型精度。1.1.3研究任务潜在客户识别是指从给定人群中准确或较为准确的找出潜在客户的过程,实质上是从数据集中分离出表征客户的数据元。因此需要在数据元类别未知的情况下预测其表征客户的可能性。这种预测应建立在对现有数据学习的基础上。从理论角度和实践过程均可证明:对数据进行相应的分析和归纳就可以得到表征潜在客户的数据所具有的共性。当测试数据集中的某数据元具有这些共性,我们就认为该数据元表征潜在客户。因此潜在客户识别的实质是对数值化信息的分类。随意抽取人群的数据信息,通常潜在客户人数远远小于非潜在客户人数,根据商务规则:从20%的客户身

8、上可获取80%的利润,因此在实际应用中采用选出20%的客户,期望选出客户中的潜在客户数目尽可能多的方式。因此在给定阈值的前提下,期望计算机通过学习,能准确或较为准确的从给定的数据信息中找出潜在客户信息,从而

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。