基于数据挖掘视角的商业银行业绩聚类方法应用研究

基于数据挖掘视角的商业银行业绩聚类方法应用研究

ID:37183819

大小:160.24 KB

页数:5页

时间:2019-05-21

基于数据挖掘视角的商业银行业绩聚类方法应用研究_第1页
基于数据挖掘视角的商业银行业绩聚类方法应用研究_第2页
基于数据挖掘视角的商业银行业绩聚类方法应用研究_第3页
基于数据挖掘视角的商业银行业绩聚类方法应用研究_第4页
基于数据挖掘视角的商业银行业绩聚类方法应用研究_第5页
资源描述:

《基于数据挖掘视角的商业银行业绩聚类方法应用研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、王李(吉林大学管理学院,吉林长春130022)摘要:数据挖掘是涉及多学科的综合技术,它可以在海量数据中发现隐藏的、未知的、潜在的有用模式或知识。商业银行在日常经营管理中形成了规模巨大的数据库,通过数据挖掘技术,对银行的各种经营数据进行挖掘和聚类分析,可以为商业银行制订、修改财务政策提供依据。关键词:数据挖掘;聚类方法;商业银行;经营管理中图分类号:TP311;F830文献标识码:A文章编号:1007-7634(2009)03-0451-05CommercialBankAchievementClusterMethod

2、AppliedResearchBasedonDataMiningWANGLi(ManagementSchoolofJilinUniversity,Changchun130022,China)Abstract:Thedataminingisinvolvesthemulti-disciplinarysynthesesthetechnology,itmaydiscoverthehideawayinthemagnanimousdata,unknown,thelatentusefulpatternortheknowledge

3、.Thecom-mercialbankhasformedthescalehugedatabaseinthedailymanagementandoperation,throughthedataminingtechnology,carriesontheexcavationandtheclusteranalysistothebankeachkindofmanagementdata,maydrawup,therevisionfinancepolicyforthecommercialbankprovidestheba-sis

4、.Keywords:datamining;clustermethod;commercialbank;operationmanagement1引言数据挖掘简介2由于现代商业银行在经济领域的作用及业务特点等方面的原因,使其拥有完善的业务系统和大型数据库,并在技术和管理方面积累了优势,这种较高的电子信息化程度,为数据挖掘的应用奠定了物质和技术基础。另外,激烈的市场竞争所带来的外在压力和业务发展创新的内在驱动,都使数据挖掘在商业银行的应用成为一个时代发展的必然。本文基于数据挖掘的视角,采用聚类技术对商业银行的财务状况及经营

5、业绩进行分析与处理,以帮助商业银行提高经营管理水平及制定相关政策提供有力依据。数据挖掘是一个交叉的学科领域。它综合了信息科学、数据库技术、统计学、机器学习、可视化方法等多项理论和技术,并在各种领域的实践中,根据实际情况大量借鉴和应用了其它学科的方法和技术【1】。数据挖掘的定义可概括成数据到知识的过程。技术上的定义是,从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取其中隐含的、事先未知的、潜在有用的信息和知识的过程【2】。数据挖掘的对象和出发点是数据,而数据一般都以数据库的形式存在,不同结构和类型的数

6、据库在数据挖掘中收稿日期:2009-01-20作者简介:王李(1974-),女,吉林长春人,讲师,博士研究生,从事商业银行信息化与效率研究.情报科学27卷452有着各自的特点和特殊的挖掘方法。数据挖掘所发现的知识最常见的有以下五类:①广义知识;②关联知识;③分类知识;④预测型知识;⑤偏差型知识。数据挖掘的基本过程和主要步骤见下图:数据集,分裂法将构造K个分组,每一个分组就代表一个聚类,K<N。并且,K个分组满足下列条件:①每一个分组至少包含一个数据记录;②每一个数据记录属于且仅属于一个分组(这个要求在某些模糊聚类算

7、法中可以放宽);(2)层次法。这种方法对给定的数据集进行层次分解,直到某种条件满足为止。具体又可分为“自底向上”和“自顶向下”两种方案。(3)基于密度的方法。基于密度的方法与其他方法的一个根本区别是:它不是基于各种各样的距离的,而是基于密度的,这样就能克服基于距离的算法只能发现“类圆形”的聚类缺点。这个方法的指导思想是,只要一个区域中的点的密度大于某个阈值,就把它加到与之相近的聚类中去。(4)基于网络的方法。这种方法首先将数据空间划分成为有限个单元(cell)的网络结构,所有的处理都是以单个单元为对象的。这样处理的

8、一个突出的优点就是处理速度很快,通常与目标数据库中的记录的个数无关,而只与把数据空间分为多少个单元有关。(5)基于模型的方法。基于模型的方法给每一个聚类假定一个模型,然后去寻找能够很好满足这个模型的数据集。这样一个模型可能是数据点在空间中的密度分布函数。它的一个潜在的假定是:目标函数集是由一系列的概率分布所决定的。图1数据挖掘过程图①数据清理:消除噪声与不一

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。