注册建造师信用评价模型研究

注册建造师信用评价模型研究

ID:78225906

大小:535.03 KB

页数:60页

时间:2024-02-06

上传者:笑似︶ㄣ無奈
注册建造师信用评价模型研究_第1页
注册建造师信用评价模型研究_第2页
注册建造师信用评价模型研究_第3页
注册建造师信用评价模型研究_第4页
注册建造师信用评价模型研究_第5页
注册建造师信用评价模型研究_第6页
注册建造师信用评价模型研究_第7页
注册建造师信用评价模型研究_第8页
注册建造师信用评价模型研究_第9页
注册建造师信用评价模型研究_第10页
资源描述:

《注册建造师信用评价模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

注册建造师信用评价模型研究ModelStudyonCreditScoringofRegisteredConstructor学科专业:管理科学与工程研究生:马云飞指导教师:王雪青教授天津大学管理学院二零零八年五月 独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得天津大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名:签字日期:年月日我是爱天大的!!学位论文版权使用授权书本学位论文作者完全了解天津大学有关保留、使用学位论文的规定。特授权天津大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:导师签名:签字日期:年月日签字日期:年月日 摘要针对传统注册建造师信用评价方法的缺陷,即大多仅停留在定性的分析,无科学的评价指标体系和评价模型,本文尝试在制定注册建造师信用评价指标体系的基础上,采用统计学习理论中最新的支持向量机方法建立信用评价模型,利用该方法支持小样本学习和良好的泛化性的优点,改进注册建造师信用评价方法。本文提出注册建造师信用评价指标体系应包括执业信用指标和个人信用指标两大部分,以保证指标体系的全面性和科学性。其中,执业信用指标分为良好行为记录认定标准和不良行为记录认定标准,后者按住房与城乡建设部建设市场各行为主体的不良行为记录认定标准的编号规则设置。个人信用指标作为执业信用指标的有力补充。本文采用支持向量机方法建立注册建造师信用评价模型,首次将此方法应用到注册建造师的信用评价,采用LIBSVM2.86作为主要建模工具,对样本数据进行网格5折交叉确认法进行核函数和核参数选择。经过四种核函数的5折交叉确认准确率的比较,最后选择准确率最高的径向基函数作为该数据的支持向量机核函数,印证了前文所述的径向基函数作为核函数的优越性。关键词:注册建造师;信用评价;指标体系;支持向量机;LIBSVM2.86 ABSTRACTInordertoovercometheweaknessoftraditionalmethodsoncreditscoringofregisteredconstructor,suchasqualitativeanalysisonly,thelackofscientificcreditscoringindexsystemandmodel,thisdissertationattemptstoestablishtheindexsystemoncreditscoringofregisteredconstructorandthecreditscoringmodelbasedonSupportVectorMachine(SVM)toimprovethemethodofregisteredconstructorcreditscoring.Thisdissertationputsforwardthatpracticecreditindexandindividualcreditindexconstitutethecreditscoringindexsystemofregisteredconstructor,soastoassuretheindexsystemiscomprehensiveandscientific.Thereamong,practicecreditindexincludesgoodbehaviorrecordaccreditationstandardandbadbehaviorrecordaccreditationstandard.ThelatterisestablishedbythecodingregulationofMinistryofHousingandUrban-RuralDevelopmentofthePeople’sRepublicofChina,andtheformeristheforcefulsupplementoftheindexsystem.SVMisfirstlyappliedtobuildthemodeloncreditscoringofregisteredconstructor.ThisdissertationadoptsLIBSVM2.86asthemajormodelingtoolandusesgrid-searchtechniqueand5-foldcross-validationtoselecttheoptimalparametervaluesofvariouskernelfunctions.Bymeansofthecomparisonoffourkernelfunctionsaboutaccuracyof5-foldcross-validation,theRBFkernelfunctionisfoundouttobethemostrationalfunction,whichsupportstheexcellenceofit.KEYWORDS:RegisteredConstructor,CreditScoring,IndexSystem,SupportVectorMachine,LIBSVM2.86 目录第一章绪论..................................................................................................................11.1研究背景及意义..............................................................................................11.2研究内容和结构安排......................................................................................31.3研究方法和技术路线......................................................................................41.3.1研究方法................................................................................................41.3.2技术路线................................................................................................4第二章文献综述..........................................................................................................62.1信用的经济理论分析......................................................................................62.1.1交易费用理论与信用............................................................................62.1.2制度变迁理论与信用............................................................................72.1.3信息经济学与信用................................................................................82.2传统信用评价模型..........................................................................................82.2.1统计学方法............................................................................................92.2.2非统计方法..........................................................................................112.3国内外信用评价模型研究现状....................................................................152.4国内外支持向量机方法的研究现状............................................................17第三章注册建造师信用评价指标体系设计............................................................193.1注册建造师信用评价指标体系设计原则....................................................193.2注册建造师信用评价指标体系设计............................................................193.2.1执业信用指标......................................................................................203.2.2个人信用指标......................................................................................243.2.3注册建造师信用评价指标体系..........................................................25第四章基于支持向量机方法的注册建造师信用评价模型设计............................264.1支持向量机方法原理....................................................................................264.1.1线性可分问题......................................................................................264.1.2近似线性可分问题..............................................................................294.1.3线性不可分问题..................................................................................324.2基于支持向量机方法的建造师信用评价模型设计....................................344.2.1数据预处理..........................................................................................354.2.2核函数及参数选择..............................................................................35 4.2.3模型训练..............................................................................................374.2.4模型应用..............................................................................................37第五章实证分析........................................................................................................385.1实验设计........................................................................................................385.1.1数据预处理..........................................................................................385.1.2核函数及参数选择..............................................................................395.1.3模型训练..............................................................................................445.1.4模型应用..............................................................................................455.2与神经网络模型的比较研究........................................................................45第六章结论与展望....................................................................................................466.1结论................................................................................................................466.2展望................................................................................................................47参考文献......................................................................................................................48发表论文和参加科研情况说明..................................................................................53致谢......................................................................................................................54 第一章绪论第一章绪论1.1研究背景及意义现代市场经济是信用经济,其市场交易绝大部分是建立在信用的基础之上的,是以信用为中介的。因此,信用是现代市场交易的一个必备的要素,信用问[1]题是建设有中国特色社会主义市场经济所必需解决的一个重要问题。2007年10月24日胡锦涛主席在党的十七大上的报告中明确指出:“完善基本经济制度,健全现代市场体系,……,健全社会信用体系。”然而在我国,很多方面都存在着信用缺失现象。企业之间不履行合同,企业对银行不履行还债业务,假冒伪劣商品充斥市场,股市、基金黑幕重重,欺诈、[2]诈骗大行其道,政府信用亟待提升等等。这些普遍存在的信用缺失现象已严重影响了经济改革和社会发展,无信现象受到人们的广泛关注,建立健全社会信用体系已成为全社会的呼声。2008年3月5日温家宝总理在十一届全国人大政府工作报告中明确指出:“在推进改革开放中,要加快现代市场体系建设,大力发展现代流通,深入整顿和规范市场秩序,推进社会信用制度建设。”正是因为社会信用在整个经济发展和社会进步中所处的重要地位,所以,我国目前社会信用缺失问题日益成为学术界和决策层的关注对象。近年来,建筑业作为国民经济支柱产业的地位愈加凸显。2007年全社会建筑业实现增加值14014亿元,比上年增长12.6%,占GDP的2.68%。2007年全社[3]会固定资产投资137239亿元,比上年增长24.8%。随着我国建筑市场开放程度的提高和建筑企业国际化进程的加快,建设行业要实现又好又快的发展,必须由粗放型经济增长方式向集约型方式转变,要建立一套交易成本低、市场运行机制健全、信息灵敏、市场扩展快的制度。法律和信用是维持市场有序运转的两个重[4]要基本机制,相比于法律,信用机制是一种成本更低的机制,因此,信用制度成为当前制度建设的重要切入点。建筑市场涉及面广,交易额大,可变因素多,但由于缺乏必要的制度约束,造成了建筑市场信用关系的严重扭曲和信用缺失行为的泛滥。从业主到总承包商、分包商,再到项目经理、施工队,层层拖欠,形成了一个复杂的“债务”连环套。政府作为公共权力的代理人,行使建筑市场监管职能,其失信行为引发了工程建设领域大量的腐败案件。承包商的失信行为引发了工程质量低下、安全事故1 第一章绪论频发现象。由此可见,建筑市场的信用缺失和失信行为,对我国国民经济和投资建设效益造成重大影响,不仅加大了企业的经营成本与风险,败坏了社会风气,[5]更使全社会资源使用效率低下,成为制约生产力发展的“瓶颈”。全国建设工作会提出:“要大力推进建筑市场信用体系建设,构建诚信信息平台,完善失信惩戒机制”。当前,信用体系建设作为进一步规范建筑市场秩序的治本之策,已经成为各方的共识。2008年2月27日,建筑业企业项目经理资质管理制度向建造师执业资格制度过渡的时间结束,项目经理资质证书停止使用,大、中型工程项目施工的项目经理必须由取得注册建造师证书的人员担任。我国建筑业从业人数约占全世界建筑业从业人数的25%,但对外工程承包额却仅占国际建筑市场的1.3%。原因固然很多,但缺乏高素质的施工管理人员是重要原因。因此,建立建造师执业资格制度也是与国际接轨、开拓国际建筑市场的客观要求。我国现有项目经理、工程管理人员的素质整体偏低。一直以来,我国建筑行业施工企业主要是通过短期的培训后经考试合格就能获得项目经理资格。如果施工企业的资质等级高,项目经理就可以随着时间的推移获得较高级别的项目经理的资格,所以项目经理资格等级的高低不取决于项目经理的管理水平,而是取决于企业的发展需求。这样的选拔规则很难保证项目经理拥有较高的理论水平和管理素质,最终导致现有项目经理的素质和管理水平参差不齐,目前许多年龄较大[6]的项目经理的专业理论水平和文化程度偏低。另外,很多受过高等教育拥有较好理论功底的高校毕业生不愿意从事建筑项目工程管理一线工作,而倾向于在建筑行业的行政管理机关和投融资单位工作,造成我国大量建筑类专业毕业生流失。项目经理人职业能力不足,导致了不少工程预算失控、建设质量不过关等现实情况的出现。根据建设部的统计资料显示,高级项目管理人才在人数上远不能满足市场需求。以上原因导致在我国建筑市场中,注册建造师信用的缺失所致的不良行为屡见不鲜。从这些不良行为的表现来看,大致可以分为四类:(1)资质方面。这类不良行为指注册建造师在资质方面不合相关法律法规规定的情况下,擅自执业的不良行为。如未依法取得相应的执业资格证书或超出执业范围和聘用企业业务范围从事执业活动的,以欺骗、贿赂等不正当手段取得注册证书的等等。(2)执业方面。这类不良行为指注册建造师在执业规则方面违反相关法律法规的行为。如同时在两个或者两个以上企业受聘并执业,同时担任两个及以上建设工程施工项目负责人等等。2 第一章绪论(3)工程质量和安全方面。注册建造师所负责的工程的质量和安全是检验其执业成果的很重要的指标之一。这类不良行为包括未按照国家法律法规、工程建设强制性标准组织施工,工程施工不符合国家有关质量、安全、环保、节能等有关规定等等。(4)其他方面。此类不良行为包括未按照国家劳动用工有关规定,规范项目劳动用工管理,切实保障劳务人员合法权益等等。以上提到的种种不良行为,导致一系列不良后果的产生,给建筑市场的秩序造成恶劣的影响,同时这些不良行为所直接带来的工程隐患也给人民的生产生活安全带来很大威胁。所以,注册建造师的信用缺失问题是当前工程建设领域亟需解决的重大问题,必须予以重视。自2002年12月5日人事部、建设部联合下发了《建造师执业资格制度暂行规定》,标志我国建立建造师执业资格制度的工作正式启动以来,建设部又先后出台了《建筑市场诚信行为信息管理办法》、《注册建造师管理规定》、《注册建造师执业管理办法》(试行)等一系列约束注册建造师执业过程中行为的相关法规,以及还在征求意见的《注册建造师信用档案管理办法》。近年来,全国各级建设行政主管部门都在建立注册建造师的信用管理评价体系,但多停留在定性的判定,最多引入粗略的打分机制,并无太多科学依据,尤其在对建造师的信用评价模型上几乎没有深入研究和进展。针对此问题,本文致力于对注册建造师信用评价模型进行深层次研究,以便对注册建造师的信用评价做出模型支持。1.2研究内容和结构安排本文分六章,其中第三章和第四章是论文的主体部分。第一章为绪论,介绍了本论文的研究背景、研究意义,研究内容,研究方法,并构建了论文的技术路线,勾勒出论文的整体轮廓。第二章为文献综述。在对大量文献的阅读和理解的基础上,先用多种经济理论对信用进行了分析,然后把传统信用评价模型分为统计学方法和非统计学方法两类进行比较研究,之后对国内外信用评价模型研究现状进行了介绍,最后对国内外支持向量机方法的研究现状进行了综述。第三章为注册建造师信用评价指标体系设计。先从设计原则上对注册建造师信用评价指标的设计进行了提纲挈领的把握,然后创新性的把注册建造师信用评价指标分为执业信用指标和个人信用指标两方面来进行阐述,组成最终的注册建造师信用评价指标体系。3 第一章绪论第四章为基于支持向量机方法的注册建造师信用评价模型设计。先对支持向量机方法进行了介绍,然后对注册建造师信用评价模型的建立按步骤进行了详细说明,建立起了基于支持向量机方法的注册建造师信用评价模型。第五章为实证分析。通过实际数据对支持向量机方法在信用评价方面的作用进行了验证,并优选出了适合该数据的核函数和参数组合。最后与人工神经网络方法进行了对比,证明了支持向量机方法的优越性。第六章为本文的结论与展望。1.3研究方法和技术路线1.3.1研究方法本文采用的研究方法主要有:(1)理论研究方法本文旨在建立针对建造师信用评价的指标体系和模型,因此在写作过程中特别注重理论分析和研究。在大量地阅读相关领域文献的基础上,首先用多种经济学理论对信用进行了分析研究,得出信用在各经济学理论中的重要性,也为论文中指标体系的建立和模型的设计提供了理论支持。(2)对比研究方法对比的方法是研究问题最常用,往往是最有效的方法。本文按照可比条件下的横比和纵比相结合的比较原则,在对信用的理论分析中,对各种经济学理论进行了对比研究;在模型选择过程中,对支持向量机方法和神经网络方法进行了横向对比研究,对支持向量机方法中的参数选择也进行了纵向对比研究,充分说明了所选模型和参数的科学准确性。(3)实证研究方法本文所提到的基于支持向量机方法的信用评价研究更多的是一个应用层面的研究,合理的实证研究更能增加其科学实践性。论文把从现实中得来的统计数据用于模型选择,通过实证研究阐述了本文所用的方法及软件的具体特性,证实了最终确定的模型的可靠性和适用性。1.3.2技术路线本文的技术路线逻辑清晰,大体的思路是:把支持向量机理论应用于注册建造师的信用评价上。具体技术路线如图1-1所示。4 第一章绪论文献资料阅读构建论文基本框架文献综述对信用的经济理论分析传统信用评价模型对比研究国内外信用评价模型研究现状国内外支持向量机方法研究现状注册建造师信用评价指标体系设计基于支持向量机方法基于径向基核函数的的信用评价模型设计支持向量机方法实证分析基于LIBSVM的数值分析总结与展望图1-1本文的技术路线5 第二章文献综述第二章文献综述在对大量文献的阅读和理解的基础上,先用多种经济理论对信用进行了分析,然后把传统信用评价模型分为统计学方法和非统计学方法两类进行比较研究,之后对国内外信用评价模型研究现状进行了介绍,最后对国内外支持向量机方法的研究现状进行了综述。2.1信用的经济理论分析信用在经济社会中起了非常重要的作用,我们可以根据现代经济学中的诸多分支,如交易费用理论、制度变迁理论、信息经济学及“委托—代理”理论等进[1]行不同角度的阐述和分析。当然,以上各种理论在经济逻辑上是彼此相通的。2.1.1交易费用理论与信用信用的维持从本质上看是一种降低交易费用的手段,因此,要说明信用维持对一个经济机体和社会机体的重要性,必须着眼于交易费用。就交易费用理论来看,信用在经济社会中的地位在于它能有效地降低交易费用,从而使交易顺利进行,市场顺利运作。这又体现在两个方面,即对外生交易费用和内生交易费用的降低。一个比较稳定的社会信用体系的形成将使可能出现的高交易费用在很大程度上被降低和克服:社会信用体系的存在和个体信用在交易中扮演的越来越重要的角色将在很大程度上修正个体的成本—收益函数,从而使社会整体理性日益趋于突破有限理性边界;在一个持续不断的交易流中,个体的履约状况和守信情况将以其商誉及其社会信用等级的方式被记录下来,从而使其机会主义行为动机因可能影响其未来商誉进而影响其未来收益而受到很大程度的抑制;社会信用体系的存在会在一定的程度上弱化未来的不确定性,换言之,在一个比较完善的社会信用体系和法律体系框架下,交易双方的行为变得更容易预期,进而使交易的后果和后续交易的展开也变得更容易预期;商誉和履约记录在社会交易中日益重要的地位将在很大程度上抑制在个别交易中数量占优方对居劣方的违约利益侵犯,从而使因这一因素造成的高交易费用在一定程度上削减。以上四个方面的交易费用削减基本上发生在内生交易费用范畴。简言之,社会信用体系的构建和运作是6 第二章文献综述降低内生交易费用,保证交易规模,从而维持市场作为有效的经济组织形式的重要条件。社会信用体系以及与之相辅相成的法律体系的有效发挥作用,将给违约者以适当的惩罚,从而保证守约者的合法权益受到有力保护,进而在一个经济体内形成一种重信守约的良好环境。这一社会环境的形成将使交易双方在议定和执行契约时不一定要花费很大的精力和时间去试图罗列所有可能出现的意外来保证不确定性被控制在最小范围之内。社会共信的默示作用将把许多明文契约无法罗列的状况和在此情况下双方的权利义务及合法产权的保护进行默示性规定,而法律规范则进一步将一些客观状况下交易双方的权利义务以法律条文的形式进行规定,这在很大程度上减少了交易双方的后顾之忧。于是,对于微观经济个体而言,其单笔交易的外生交易费用得到切实有效的降低,交易的速度则得到很大的提高;对宏观市场运行而言,则有利于降低整个交易体系的外生交易费用,提升交易的频率,从而使市场更平稳、更高效的运行。综合上面的分析,一个完善、稳定的社会信用体系框架的存在将在很大程度上削减交易过程中不可避免的内生和外生交易费用,从而使社会交易得以顺畅进行核持续扩展,市场机制得以继续发挥作用,从而使整个经济体因交易的扩展而不断完善、发展。2.1.2制度变迁理论与信用制度变迁理论认为,制度的出现乃至嗣后的不断创新和变迁,使人们达成了在交易时进行合作的共识,约束了交易双方的权利义务关系,减少了交易的不确定性,从而减低了交易成本,推进了分工演进。新制度经济学者对不同层次上的制度进行了比较系统的区分:制度环境、制度结构和制度安排。信用作为“一种社会游戏规则、一种人类设定来限制他们的行为互动的局限条件”,理所应当被视为一种“制度”,而其本身包含的丰富内涵则决定了它是一种“制度结构”。一个社会信用体系的构成,就制度意义上看,有正式规则,即法律明文规定或经济生活中自发形成并得到法律默认的各种授信制度;有非正式规则,即为授信双方或多方所默认的遵守契约、履行契约等不言自明的认识;也有实施机制,即由法律或契约规定的各种授信制度的贯彻方式和对失信行为的惩罚。三者之中,正是规则的变迁和演进最为活跃,实施机制的变迁总是落后于正式规则,而非正式规则的演变则更在其后。如果说作为制度结构的社会信用体系在经济体的演进变迁中以及仍在进行的秩序扩展中起了不可替代的作用的话,那么,作为制度环境的社会信用观念则7 第二章文献综述在更长远、更深层次的意义上决定了社会信用体系的特点和演进方向,从而对经济体的演进变迁产生重大影响。2.1.3信息经济学与信用由于信息不对称的广泛存在,在经济交易过程中就总是存在着“委托—代理”关系,信息经济学研究的重点就在于在各种条件的委托框架下交易双方如何作为,以使交易顺利展开。表2-1信息不对称理论基本框架非对称信息内容隐藏信息(知识)隐藏行动非对称信息发生时间事前信息不对称逆向选择模型—事后信息不对称隐藏信息的道德风险模型隐藏行动的道德风险模型信息经济学研究的重点在于委托人应如何制定合理的激励约束合同来有效消除代理人的代理风险。要实现这一目的,一个稳固、有效的社会信用体系的存在是保证这个激励合同能够被贯彻执行的必备前提。如果说交易费用理论是以经济人的有限理性假设为理论前提的,那么信息经济学则是进一步从信息的意义上揭示了有限理性的根本原因。经纪人之所以仅具有有限理性,是因为信息不对称是广泛存在的。就交易费用理论角度看,信用在经济社会中之所以占有非常重要的地位,是因为它能有效地削减交易中不可避免要发生的交易费用,从而使交易得以更顺畅的继续、扩展;就信息经济学角度看,信用在经济社会中的地位仍是不可替代的,甚至可以这样说,整个信息经济学都是建立在一个稳定可靠的社会信用体系基础上的。无论是逆向选择模型还是道德风险模型,社会信用体系的存在和有效性都是其立论基础,缺乏了这一必要前提,各种模型化研究都将不具有现实意义。2.2传统信用评价模型信用评价实质上是将一个总体按照不同的特征分成若干个不同组,随着市场竞争的加剧以及计算机技术的发展,越来越多的计量方法被运用到信用评价领域[7],而大部分的信用评分模型都是其中的一种方法或将几种方法结合起来使用。[8]现将传统信用评价分为统计学方法和非统计学方法两类进行比较研究。8 第二章文献综述2.2.1统计学方法统计学方法包括回归分析、判别分析和k-近邻判别等。1.回归分析[9]在信用评价中,回归分析的种类有四种:(1)线性回归线性回归与线性判别分析在形式上非常相似,试图用评价指标的线性组合来揭示消费者的违约概率问题。其表达式可以写成:nZ=+CX0∑αii(2-1)i=1C为一常数。0线性回归主要应用于信用评分的两类划分问题(信用好和信用不好),其指标权重系数可以用最小二乘法得到。Orgler(1971)把回归分析应用于消费者贷款,并分析设计了一个评价未偿还贷款的分值卡。由于未偿还贷款包含了消费者的行为信息,他发现消费者的行为特征比申请表特征更能表明贷款的未来质量。(2)逻辑回归逻辑回归是一种非线性分类的统计方法,用于因变量为定性指标的问题,基本假设是似然比的对数是属性的线性回归,其基本函数关系可以表示为:(LXH(1))nln=+CX0∑αii(2-2)()LXH()2i=1H和H分别为信用好和不好两类人,L为似然函数。12逻辑回归对训练样本要求表示成好坏两类人群即可,而结果都能得到精确的分值,实际上这个分值被认为是属于好(或不好)的概率。逻辑回归不要求LDA的假设,但满足LDA的假设时,二者等效或优于LDA,而且逻辑回归在处理纲目数据上有一定的优越性。(3)Probit回归和Tobit回归另外两种非线性回归的方法是Probit回归和Tobit回归。Probit回归把逻辑回归中的似然比对数函数改变为正态分布函数的反函数,其模型为:p−1NpC()ii=+0∑αxij(2-3)j=19 第二章文献综述Tobit模型可以表示为:⎧⎪⎧p⎫⎫⎪pxii=min1,max⎨⎨⎬∑αij,0⎬(2-4)⎩⎭⎪⎩⎭j=1⎪x为待估消费者i的第j个属性,N为正态函数,p为概率。ijiGrablowsky和Talley(1981)在信用评分中使用了Probit模型并与差别分析进行了比较,结论是前者较好。两者得出的都是属于好或者不好的概率值,但在实际中,由于决策者关心的是在不太清楚的条件下如何做出正确的决策,而不是确定一个信用不好的人的概率究竟是0.05还是-0.05,这使得上述两种回归在实际的信用评分中并不常用。[10]2.判别分析判别分析是一种用来区分、判断个体所属类别的统计技术,它的目标是把一群个体分成两个或多个预先确定的小组,然后判断和预测新的个体应该属于哪一个小组。比如,判断信用年账户未来付款表现属于“好”或“坏”两组中的哪一组,判断市场营销的目标对象属于“高度可能反应”、“中度可能反应”、“低度可能反应”三组中的哪一组等。判别分析在市场营销分析、信用风险评分模型等领域都可以应用。判别分析的步骤一般如下:第一,把样本按目标变量分成预先界定的若下小组;第二,按照一定的数学最优算法,对每一小组样本发展出一个判别函数(DiscriminantFunction),该判别函数是预测变量的线性组合;第三,对新的个体计算其每一组判别函数的值(评分),分值最高的函数值表明这个新的个体应属该小组。对于进入线性判别函数中的预测变量(自变量)的选择,可以由分析人员根据经验选择,也可以由计算机的stepwise程序自动选择。判别分析中的stepwise程序与逻辑回归中的stepwise程序原理类似,预测变量被不断地自动加入模型中或被从模型中删除,直到模型达到统计意义上的最优化。判别分析技术的优点:适用于二元性或多元性目标变量,能够判断、区分个体应该属于多个不同小组中的哪一组,而逻辑回归只能预测二元性的目标变量。判别分析技术的缺点:(1)假设自变量的分布为正态分布,而实践中的数据往往不是完全的正态分市。尽管判别分析对轻微的偏离正态分布具有一定的抗震荡性,但严重的偏离可能导致统计结果的不可靠性;10 第二章文献综述(2)如果使用stepwise功能,则有过分微调的可能;(3)多维相关性可能导致模型的不稳定性和不可靠性。[11]3.k-近邻判别k-近邻判别分析方法的基本思想是:假定有c个类别为www,,,,…w的样123c本集合,每类有标明类别的样本N个,ic=1,2,…,.i设样本的指标有z个,则样本点的指标将可以构成一个z维特征空间,所有的样本点在这个z维特征空间里都有惟一的点与它对应。则对任何一个待识别的样本x,把它也放到这个z维特征空间里,通过构造一个距离公式(一般采用欧氏空间距离公式),可以找到样本x的k个近邻。又设这N个样本中,来自w类1的样本有N个,来自w类的样本有N个,…,来自w类的样本有N个。若122cckkk,,,,…k分别是k个近邻中属于www,,,,…w类的样本数,则我们可定义123c123c判别函数为:gxki()==,1,2,,…c(2-5)ji分类规则是,若gx()=maxk(2-6)ji则分类x属于w。j这一方法的直观解释相当简单,对未知样本x,我们只要比较x和N个已知类别样本之间的距离,并判定x和离它最近的样本同类。k-近邻判别的方法的主要特点在于它的非参数的特点使得在特征变量空间上对于不规则变量的建模成为可能,与此同时,当数据为多维时,k-近邻判别的功能被认为优于其他非参数估计方法,比如它可以避免判别分析方法中存在的参数估计的样本偏差问题,也可以避免分类树方法中当问题的复杂性增加时分类树模型经常会出现的组合爆炸问题。2.2.2非统计方法1.线性规划将线性规划方法应用在信用评分时,其结果依然是产生一个线性评分卡。其基本思路可以这样来描述:假设:我们有一个样本,其中有n个好客户(将其标记为in=1,2,…,)、nGGB个坏客户(将其标记为in=++1,n2,…,nn+);我们可以从客户的申请表中GGGB得到m个预测变量,因此客户i的特征项向量为x,,,,xx…x.iii123im在一个最理想的信用评分中,我们的目的是找到一组权重wj()=1,2,…,mj11 第二章文献综述以及一个临界值c,使得:对一个好的客户,满足:wx+wx++"wx>c11ii22mim(2-7)对一个坏的客户,满足:wx+wx++"wx0,来综合这两个基本目标,就得到下面i=1的优化问题:l12minwC+∑ξi,(4-17)wb,,ξ2i=1st..y⎡⎤(wx⋅+≥−=)b1ξ,i1,2,,,…l(4-18)ii⎣⎦i0,ξ≥=il1,2,…,.(4-19)i其中C为可调参数,C越大表示对错误分类的惩罚越大。这是一个二次规划问题,其最优解为下面拉格朗日函数的鞍点:lll12Lwb(),,α=+−wCξα⎡⎤ywx()()⋅+b+ξ−1−βξ(4-20)2∑ii∑∑⎣⎦iiiiiii==11i=1其中,α≥≥0,β0为拉格朗日乘子,由于在鞍点处的w、b和ξ的梯度为零,因ii此可得ll∂L=−wy∑∑ααiiixwy=⇒=0iiix(4-21)∂wii==11ll∂L==∑∑ααiiyy00⇒=ii(4-22)∂bii==11∂L=−−=Cαβ0(4-23)ii∂ξi将式(4-21)-(4-23)代入式(4-20),并对它关于α求最大,得到(4-17)-(4-19)的对偶最优化问题lll1max∑∑ααii−⋅∑αjyyxxij()ij,(4-24)α2ii==11j=1lst..∑αiiy=0,(4-25)i=10,≤α≤=Ci1,2,…,l.(4-26)i30 第四章基于支持向量机方法的注册建造师信用评价模型设计求解问题(4-24)-(4-26)得到的α中,α可能是:①α=0;②0<<αC;iiii③α=C。后两者所对应的x为支持向量。在支持向量中,α=C所对应的x位iiii于边界上,称为边界支持向量(BoundarySupportVector,BSV);0<<αC所对i应的x位于间隔内,称为标准支持向量(NormalSupportVector,NSV)。根据iKKT条件知,在最优点,拉格朗日乘子与约束条件的积为0,即αξ⎡⎤y()()wx⋅++−==b10,1i,2,,…l(4-27)ii⎣⎦ii0,βξ=il=1,2,…,.(4-28)ii对于标准支持向量(0<<αC),由式(4-23)可知β>0,则由式(4-28)得到ξ=0,iii因此,对于任一标准支持向量,满足ywxb⎡(⋅)+=⎤1(4-29)ii⎣⎦所以b为bywxy=−⋅=−ii()ij∑αyxxxJj(i⋅j),i∈N(4-30)xJj∈其中JN为标准支持向量的集合,J为支持向量的集合。为了计算可靠,可以对所有标准支持向量分别求b的值,然后求平均。式(4-18)-(4-19)的约束条件约束了wb,使得经验风险误差为0,同时最小化w,使VC维最小,因此问题(4-17)-(4-19)的最优化体现了结构风险最小化原则,具有较好的泛化能力。根据上面的分析与推导,得出求解近似线性可分问题的支持向量分类机的具体步骤如下:算法4-2近似线性可分支持向量分类机n1.已知训练集Tx==∈{(),,1yi,2,,,……lxR},y∈{+1,1−},1i=,2,,l;iiii2.选取适当的惩罚参数C,构造并求解优化问题(4-24)-(4-26),得到最优解T****αα=()12,,,αα…l;l**3.计算wy=∑αiiix;i=1l****4.选择α的一个介于0与C之间的分量αj,计算by=−ji∑yxxαj()i,j;i=1****5.构造分类超平面(wxb⋅+=)0,由此求得决策函数f()xw=⋅sgn⎡(x)+b⎤。⎣⎦从上面分析可知,支持向量分类机中计算的复杂度不取决于空间维数,而是取决于样本点数,尤其是支持向量数,因此支持向量分类机可以有效地处理高维问题。31 第四章基于支持向量机方法的注册建造师信用评价模型设计4.1.3线性不可分问题对于图4-3所示的问题,无论用任何一条直线去划分都会错分很多训练样本点,这类问题被称为线性不可分问题,这时就得使用非线性分类学习机来求解。图4-3线性不可分问题对于线性不可分问题,支持向量机的思想是:通过引进一个非线性映射ϕ,将低维的输入空间中的线性不可分问题,转化为高维的特征空间中的线性可分问题,在高维的特征空间中,就可以利用线性分类学习机。如图4-3所示的问题,对于这类问题,显然不能用超平面去划分,而需要用“超曲面”来代替。而寻找超曲面的过程非常困难,通常引入一个非线性映射函数ϕ将输入空间映射到一个高维特征空间,nϕϕ:x⊂→⊂Rx()H(4-31)其中H为特征空间。在特征空间构造线性划分,此时分类超平面为:⎡⎤⎣⎦wxb⋅ϕ()+=0(4-32)其中wHbR∈∈,为下面最优化问题的解l12minwC+∑ξi,(4-33)wb,,ξ2i=1st..y⎡⎤(w⋅+ϕξ(x))b≥1−,i=1,2,,,…l(4-34)ii⎣⎦i0,ξ≥=il1,2,…,.(4-35)i相应的对偶问题为:lll1max∑∑ααii−∑αjyyKxxij()i,j,(4-36)α2ii==11j=132 第四章基于支持向量机方法的注册建造师信用评价模型设计lst..∑αiiy=0,(4-37)i=10,≤α≤=Ci1,2,…,l.(4-38)i其中Kxx(),,=(ϕϕ()x()x)称为核函数,通过求解对偶问题来确定最终的决策ijij函数:l⎡⎤f()xy=sgn⎢∑αiiK(xi,x)+b⎥(4-39)⎣i=1⎦根据上面的分析与推导可知线性不可分问题的支持向量分类机的步骤如下:算法2-3线性不可分支持向量分类机(C-SVM)n1.已知训练集Tx==∈{(),,1yi,2,,,……lxR},y∈{+1,1−},1i=,2,,l;iiii2.选取适当的核函数Kxx(),和惩罚参数C,构造并求解优化问题(4-36)-(4-38),得到最优iT****解αα=(),,,αα…;12ll**3.计算wy=∑αiiix;i=1l****4.选择α的一个介于0与C之间的分量αj,计算by=−ji∑yxxαj()i,j;i=1l**5.构造分类超平面∑αiiyKxx()i,0+b=,由此求得决策函数i=1l⎡⎤**f()xy=+sgn⎢⎥∑αiiK(xi,x)b。⎣⎦i=1这就是支持向量分类机。概括地说,支持向量分类机就是首先通过用内积函数定义的非线性变换将输入空间变换到一个高维空间,在这个空间中求(广义)[69]最优分类面。SVM分类函数形式上类似于一个神经网络,输出是s个中间节点的线性组合,每个中间节点对应一个支持向量,如图4-4所示。y输出(决策规则)s⎧⎫yy=sgn⎨∑αiiK()xi,x+b⎬⎩⎭i=1α11yα22yαsys权值αiiyK()xx1,K()xx2,K(xxs,)……基于个支持向量机sx12,,,xx…s的非线性变换(内积)12d输入向量x=()xx,,,…x……123dxxxx图4-4支持向量机示意图33 第四章基于支持向量机方法的注册建造师信用评价模型设计[66][68][69][67]只要函数Kxx(,)满足Mercer条件,都可以作为核函数。可以证明,i如果核函数Kxx(),选取的适当,可将输入空间中的线性不可分问题转化为特征i空间中的线性可分问题。由式(4-36)-(4-39)可知,尽管通过非线性函数将样本数据映射到具有高维甚至无穷维的特征空间,并在特征空间中构造最优分类超平面,但在求解最优化问题和计算决策函数时并不需要显式计算该非线性函数,而只需要计算核函数,从而避免特征空间维数灾难问题。[70]常见的核函数有:(1)线性核函数Kxx(,)=(xx⋅),(4-40)ijij(2)多项式核函数dKxx(),,=⎡⎤γγ(xx⋅+)r>0,(4-41)ij⎣⎦ij其中,d为多项式阶数,γ、r为用户选择的常数;(3)径向基核函数(RBF)2Kxx(),e=xp−−γγxx,0>;(4-42)ij(ij)其中,γ为用户选择的常数。(4)Sigmoid核函数Kxx(),t=anh⎡γ(xx⋅+)r⎤(4-43)ij⎣ij⎦其中,γ、r为用户选择的常数。4.2基于支持向量机方法的建造师信用评价模型设计本文根据支持向量分类机方法的原理,对我国注册建造师的信用进行模型设计和评价。目前有关SVM计算的相关软件有很多,如LIBSVM、mySVM、SVMLight等,本文使用LIBSVM2.86(该软件最新版本,2008年4月1日编译完成)进行基于SVM方法的注册建造师信用评价模型设计。LIBSVM是台湾大学林智仁(LinChih-Jen)等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其它操作系统上应用;该软件还有一个特点,就是对SVM所涉及的参数调节相对比较34 第四章基于支持向量机方法的注册建造师信用评价模型设计少,提供了很多的默认参数,利用这些默认参数就可以解决很多问题;并且提供了交互检验(CrossValidation)的功能。4.2.1数据预处理1.数据格式转换数据格式转换指把获取的注册建造师的信用数据按照LIBSVM2.86软件包所要求的格式准备成数据集,其格式如下:

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭