基于数据挖掘的银行信用评分系统研究

基于数据挖掘的银行信用评分系统研究

ID:32214985

大小:1.52 MB

页数:53页

时间:2019-02-01

基于数据挖掘的银行信用评分系统研究_第1页
基于数据挖掘的银行信用评分系统研究_第2页
基于数据挖掘的银行信用评分系统研究_第3页
基于数据挖掘的银行信用评分系统研究_第4页
基于数据挖掘的银行信用评分系统研究_第5页
资源描述:

《基于数据挖掘的银行信用评分系统研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摹十数据挖掘的银行信用计分系统研究的数据趋势。分类可以用来预测数据对象的类标记。有时也用于预测某些空缺的或不知道的数据值。当被预测的值是数值数据时,称之为预测。尽管预测可以涉及数据值预测和类标记预测,通常预测限于值预测,

2、t【;j此不同丁分类。预测也包含基丁。可用数据的分布趋势识别。4.聚类分析将物理或抽象对象的集合分组由类似的对象组成的多个类的过程被称为聚类。与分类和预测不同,聚类分析数据对象,而不考虑己知的类标记。一般情况下,训练数据中不提供类标记,因为不知道从何开始。聚类,可以用于产生这种标记。由聚类所产生的簇是一组数据对象的集

3、合,这些对象根据最大化类间的相似性、最小化类间的相似性的原则进行聚类或分组。对象的簇(聚类)这样形成,使得在一个簇中的对象具有很高的相似性,而与其他簇中的对象很不相似。所形成的每个组可以看作一个对象类,由它可以导出规则。聚类也便于分类编制,:悔观察到的内窑组织成类分层结构,把类似的事件组织在一起。5.孤立点分析数据库中可能包含一些数据对象,它们与数据的一般行为或模型不一致,这些数据对象是孤立点((outlier)。许多数据挖掘算法试图使孤立点的影响最小化,或者排除它们,但是由于一个人的噪声可能是另一个人的信号,这可能导致重要的隐藏信息

4、的丢失。换句话说,孤立点本身可能是非常重要的,例如在欺诈探测中,孤立点可能预示着有欺诈行为。这样的孤立点往往比正常出现的邦些更有趣。孤立点数据分析称作孤立点挖掘(outliermining)。6.演变分析数据演变分析(ev01utionanalysis)描述行为随时间变化的对象的规律或趋势,并对其建模。尽管这可能包括时间相关数据的特征化、区分、关联、分类或聚类.这类分析的不同特点包括时间序列数据分析、序列或周期模式匹配和基于类似性的数据分析。上面这几个方面囊括了所有数据挖掘在商业领域应用的几个方向,对于不同的任务,有具体的挖掘技术来实

5、现。23数据挖掘的主要技术如果从整体上看数据挖掘技术,可以分为统计分析类、知识发现类和其他类型的数捌挖捌技术’.1.统计分析类统计分析(绒称数据分析)技术中使川的数据挖掘模型有线性分析和1r线性分析、可I7可I苎±墼堡竺塑塑堡!!堕旦塑坌墨堑盟茎第六章问题的总结与展望。4基,效制挖掘的银行信用评分系统研究第二章数据挖掘从数据挖掘的发展可以看出:挖掘本来就是顺应应胄{

6、的需求而产生的。它将复杂的科学理论知识以一种简单易懂且可应用的方式表示出来。其商业趋势也越来越明显,而构造数据挖掘系统则是数据挖掘面向应用商业化的必经之路。数据挖掘系统的

7、构造牵涉到很多方面的相关知识:数据挖掘技术的选择,数据挖掘方法论的选择,数据挖掘应用领域知识等多方面内容。充分地理解这些理论与技术的特点是成功地运用这些理论与技术构造数据挖掘系统的前提。2.1数据挖掘技术数据挖掘系统的构建是建立在数据挖掘技术的发展成熟且具备商业应用的情况下,虽然有很多的技术与算法,但是并不是每一个技术,每一个算法都能够投入到商业运作中,所以在构造系统之前必须对数据挖掘技术的整体框架非常熟悉,并且对各种常用技术的应用场合及特点也必须清楚。从而选择合适的技术建立挖掘的模型。2.2基本概念及主要方法数据挖掘顾名思义就是从大

8、量的数据中挖掘出有用的信息。从技术角度和应用角度看其定义均有所不同”3从技术角度看,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们不知道的、但又是潜在有用的信息和知识的过程”“”从广义上理解,数据、信息是知识的表现方式,但是人们更将概念、规则、模式、规律和约束等看作知识。这里所说的知识都是相对的,是有特定前提和约束条件的,在特定领域中具有实际虑用价值。同时还要能够易于被用户理解,最好齄用自然语言表达所发现的结果。人们将数据看作形成知识的源泉,好像从含金的人罐矿石中淘金一样。原始数据可以是结构化

9、的,如关系数据库中晌数据:也可以是半结构化的.如文本、图形雨j幽像数据,荽至是分布在网络上的异构数据,发现知识的方法可以缝数学的,也叮;=王是竹数r学的:uj以是演绎的,也可以是归纳的。发现的知识可以Hj丁信息管理、夯询优化,决策支持和过程控制等。因此,数据挖掘是一门交义学科,它把人们对数据的应州从低层?欠的简C摹十数据挖掘的银行信用计分系统研究的数据趋势。分类可以用来预测数据对象的类标记。有时也用于预测某些空缺的或不知道的数据值。当被预测的值是数值数据时,称之为预测。尽管预测可以涉及数据值预测和类标记预测,通常预测限于值预测,

10、t【

11、;j此不同丁分类。预测也包含基丁。可用数据的分布趋势识别。4.聚类分析将物理或抽象对象的集合分组由类似的对象组成的多个类的过程被称为聚类。与分类和预测不同,聚类分析数据对象,而不考虑己知的类标记。一般情况下,训练数据中不

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。