数据挖掘技术在金融行业中的应用.pdf

数据挖掘技术在金融行业中的应用.pdf

ID:57023010

大小:92.13 KB

页数:2页

时间:2020-07-31

数据挖掘技术在金融行业中的应用.pdf_第1页
数据挖掘技术在金融行业中的应用.pdf_第2页
资源描述:

《数据挖掘技术在金融行业中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2006NO.25科技资讯SCIENCE&TECHNOLOGYINFORMATION学术论坛数据挖掘技术在金融行业中的应用刘春明(中国银行北京分行信息科技部)摘要:随着计算机信息技术的发展,信息共享使得人们能得到越来越多的数据。与此同时出现了分析这些海量数据的一门技术——数据挖掘技术。本文首先介绍了数据挖掘技术的定义以及常用挖掘方法,然后介绍了数据挖掘技术在金融行业的典型应用。关键字:数据挖掘金融数据中图分类号:G202文献标识码:A金融部门每天的业务都会产生大量数和人工智能技术发展的产物。从使用的技术客户实施最优质的服务。重点客户的发现通据,利用目前的数据库系统可以有效地实现

2、角度,主要的数据挖掘方法包括:常采用一系列数据处理、转换过程、AI人工数据的录入、查询、统计等功能,但无法发现2.1决策树方法:利用树形结构来表示智能等数据挖掘技术来实现。通过分析客户数据中存在的关系和规则,无法根据现有的决策集合,这些决策集合通过对数据集的分对金融产品的应用频率、持续性等指标来判数据预测未来的发展趋势。缺乏挖掘数据背类产生规则。国际上最有影响和最早的决策别客户的忠诚度;通过对交易数据的详细分后隐藏的知识的手段,导致了数据爆炸但知树方法是ID3方法,后来又发展了其它的决策析来鉴别哪些是银行希望保持的客户;通过识贫乏”的现象。与此同时,金融机构的运作树方法。挖掘找

3、到流失的客户的共同特征,就可以在必然存在金融风险,风险管理是每一个金融2.2规则归纳方法:通过统计方法归纳,那些具有相似特征的客户还未流失之前进行机构的重要工作。利用数据挖掘技术不但可提取有价值的if-then规则。规则归纳技术针对性的弥补。以从这海量的数据中发现隐藏在其后的规律,在数据挖掘中被广泛使用,其中以关联规则3.3客户行为分析。而且可以很好地降低金融机构存在的风险。挖掘的研究开展得较为积极和深入。找到重点客户之后,可对其进行客户行学习和应用数扼挖掘技术对我国的金融机构2.3神经网络方法:从结构上模拟生物为分析,发现客户的行为偏好,为客户贴身定有重要意义。神经网络,以模

4、型和学习规则为基础,建立3制特色服务。客户行为分析又分为整体行为种神经网络模型:前馈式网络、反馈式网络和分析和群体行为分析。整体行为分析用来发1.数据挖掘概述自组织网络。这种方法通过训练来学习的非现企业现有客户的行为规律。同时,通过对不1.1数据挖掘的定义线性预测模型,可以完成分类、聚类和特征挖同客户群组之间的交叉挖掘分析,可以发现对于数据挖掘,一种比较公认的定义是掘等多种数据挖掘任务。客户群体间的变化规律,并可通过数据仓库W.J.Frawley,G.PiatetskShapiro等人提2.4遗传算法:模拟生物进化过程的算的数据清洁与集中过程,将客户对市场的反出的。数据挖掘就是

5、从大型数据库的数据中法,由繁殖(选择)、交叉(重组)、变异(突变)馈自动输人到数据仓库中。通过对客户的理提取人们感兴趣的知识、这些知识是隐含的、三个基本算子组成。为了应用遗传算法,需要解和客户行为规律的发现,企业可以制定相事先未知的、潜在有用的信息,提取的知识表将数据挖掘任务表达为一种搜索问题,从而应的市场策略。示为概念(Concepts),规则(Rules)、规律发挥遗传算法的优化搜索能力。3.4为多维数据分析和数据挖掘设计和(Regularities)、模式(Patterns)等形式。这个2.5粗糙集(RoughSet)方法:Rough构造数据仓库。例如,人们可能希望按月、

6、按定义把数据挖掘的对象定义为数据库。集理论是由波兰数学家Pawlak在八十年代初地区、按部门、以及按其他因素查看负债和收随着数据挖掘技术的不断发展,其应用提出的一种处理模糊和不精确性问题的新型入的变化情况,同时希望能提供诸如最大、最领域也不断拓广。数据挖掘的对象已不再仅数学工具。它特别适合于数据简化,数据相关小、总和、平均和其他等统计信息。数据仓库、是数据库,也可以是文件系统,或组织在一起性的发现,发现数据意义,发现数据的相似或数据立方体、多特征和发现驱动数据立方体,的数据集合,还可以是数据仓库。与此同时,差别,发现数据模式和数据的近似分类等,近特征和比较分析,以及孤立点分析等

7、,都会在数据挖掘也有了越来越多不同的定义,但这年来已被成功地应用在数据挖掘和知识发现金融数据分析和挖掘中发挥重要作用。些定义尽管表达方式不同,其本质都是近似研究领域中。3.5货款偿还预测和客户信用政策分析。的,概括起来主要是从技术角度和商业角度2.6K2最邻近技术:这种技术通过K有很多因素会对货款偿还效能和客户信用等给出数据挖掘的定义。个最相近的历史记录的组合来辨别新的记录。级计算产生不同程度的影响。数据挖掘的方从技术角度看,数据挖掘就是从大量这种技术可以作为聚类和偏差分析等挖掘任法,如特征

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。