数据挖掘在银行交叉销售中的应用研究

数据挖掘在银行交叉销售中的应用研究

ID:34033804

大小:921.19 KB

页数:4页

时间:2019-03-03

数据挖掘在银行交叉销售中的应用研究_第1页
数据挖掘在银行交叉销售中的应用研究_第2页
数据挖掘在银行交叉销售中的应用研究_第3页
数据挖掘在银行交叉销售中的应用研究_第4页
资源描述:

《数据挖掘在银行交叉销售中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘在银行交叉销售中的应用研究423*数据挖掘在银行交叉销售中的应用研究于海波姜锴合肥工业大学,合肥230009摘要:数据挖掘通常又称为数据中的知识发现(KDD),是自动或方便地提取代表知识的模式。本文以商业银行业务数据为研究对象,使用SPSS公司Clementine工具提供的关联规则Apriori算法,对银行客户持有外延产品情况进行数据挖掘,取得频繁项集,为银行产品交叉销售提供支持。关键词:数据挖掘KDD交叉销售关联规则1引言中国加入世贸组织,金融领域全面引入国际竞争。商业银行在不断扩展业

2、务范围、不断加大科技投入的同时要注重以客户为中心的管理,对客户需求的满足能力是银行能否与客户保持紧密联系、获得发展的关键所在。数据挖掘(DataMining)是近些年企业界相当热门的话题,它利用统计与人工智能的算法,从庞大的[1]企业历史资料中,找出隐藏的规律并建立准确的模型,用以预测未来。应用数据挖掘技术对银行海量的以往交易数据进行分析,可以获得潜在规则,预测银行客户需求,创造个性化产品,改善自身营销,为商业银行业务发展提供强有力的支持。有关研究表明,开发一个新客户的费用是保留一个老客户费用的

3、5倍,成功保留老客户可大幅增加企业的利润,交叉销售就是企业保留老客户的一种非常重要的方法。交叉销售是一种以企业和客户的现有关系为基础去推销另一个产品的营销战略,是通过对现有客户扩大销售来增加利润的一个有效手段。本文着重介绍数据挖掘中的关联规则算法及其在银行外延产品交叉销售中的应用。2关联规则与Apriori算法关联分析的目的是找出数据库中隐藏的关联网,挖掘出隐藏在数据库中的一些关联规则,利用这些关[2]联规则可以根据已知情况对未知问题进行推测判断。任何两个变量间都可能存在着潜在的关联,那么怎样决

4、定哪些关联确实具有代表性,真的很有作用,哪些关联只是假象或者毫无用处呢?在考察关联规则时,需要同时考虑三条独立的标准,即支持度(support)、置信度(confidence)和增益(lift)。支持度:1)交易集合(交易数据库)D中包含某个交易X的个数称为X在D中的支持计数。例如,D={T1,T2,T3}包3个交易,其中T1={A,B,C}、T2={B}、T3={B,C,D},如果X={B,C},则D中存在T1和T3两个交易包含X,此时称X在D中的支持计数为2。2)假定X是一个项目集,D是一个

5、交易集合,称D中包含X的交易个数与D中总的交易个数之比为X在D中的支持度,记作sup(X)。在上例中,包含X的项目个数是2,D中总的交易个数是3,则X在D中的支持度为2/3,即sup(X)=P(X)=66.7%。3)关联规则的一般形式为:X=>Y,其含义为X出现的同时也导致Y出现。关联规则X=>Y的支持度sup(X=>Y)=sup(X∪Y)=P(X∪Y)。支持度是对关联规则的重要性的度量,表示了关联规则的频度。当给定最小支持度时,若某一项集的支持度大于或等于最小支持度,则称该项集是频繁项集,含有

6、K个*作者简介:于海波(1980-),男,在职研究生;姜锴(1973-),男,在职研究生.424计算机技术与应用进展·2010项的频繁项集则称为频繁K-项集。关联规则挖掘的重点便是找出所有频繁项集。置信度又称为可信度。设交易集合D中支持项目集X的交易中有c%的交易同时支持项目集Y,则称c%为关联规则X=>Y的置信度,记作conf(X=>Y)。由置信度的定义可知,conf(X=>Y)=sup(X∪Y)/sup(X)=P(Y

7、X)。一个规则的置信度范围在0和1之间,指出现了项目集X的交易中,出现项目

8、集Y的概率。置信度是对关联规则准确度的度量,表示了关联规则的强度。增益是两种可能性的比较,一种是在已知购买了左边商品情况下购买右边商品的可能性,另一种是任意情况下购买右边商品的可能性。规则X=>Y的增益为:lif(X→Y)=P(Y

9、X)-P(Y)。这个标准和数据挖掘中其他模型的选择标准一样,通过与“原有”规则的比较,来测量该规则提高预测准确性的程度。有时也把增益称为改良,因为它可以测量预测改进的程度。关联规则挖掘算法以算法Apriori为代表。Apriori算法把挖掘关联规则的过程分为两个阶段:

10、1)获取频繁集。这些项集出现的频繁度至少和预定义的最小支持度一样。2)由频繁集产生关联规则。这些规则必须满足最小可信度。3实例分析3.1数据准备[3]建立数据仓库,进行数据挖掘,在大量的“数据中挖掘知识”,首先要了解数据含义。客户通过购买或使用银行产品与银行发生关系。银行产品是指银行金融机构向市场提供的能满足人们某种愿望和需求的,与货币相关的一切商品,是金融产品的重要组成部分。银行个人产品具有多样性的特点。商业银行作为以营利为目的的企业,当然首要关心的也是产品所带来的收益。所以习惯上,按照不同产

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。