企业管理二分类问题研究综述.doc

企业管理二分类问题研究综述.doc

ID:51340827

大小:65.50 KB

页数:6页

时间:2020-03-22

企业管理二分类问题研究综述.doc_第1页
企业管理二分类问题研究综述.doc_第2页
企业管理二分类问题研究综述.doc_第3页
企业管理二分类问题研究综述.doc_第4页
企业管理二分类问题研究综述.doc_第5页
资源描述:

《企业管理二分类问题研究综述.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、企业管理二分类问题研究综述摘要:通过梳理企业管理领域的二分类问题,发现二分类支持向量机广泛应用于客户流失预测、上市公司财务困境预警和信用风险评估。并且为了提高预测精度,学者不断改进该模型:为适应具体数据特征,如数据存在外点或噪声点、非平衡性、垂叠性、错分代价差异性等,相应引入模糊、加权、双隶属支持向量机以及代价敏感性学习机制等。关键词:二分类支持向量机(SVM)企业管理综述1概述当前,企业管理领域中的客户流失预测、公司财务困境预警、信用风险评估已成为学术界和业界关注的焦点,能否科学合理的对其进行预测,

2、关乎企业生存和发展。利用客户静态属性数据,预测客户是否流失;利用公司财务、经营情况,预测上市公司是“财务状况正常”或“财务状况异常”;利用借款人财务、非财务状况,预测其信用状况是“正常”或“违约”。虽然上述3领域研究方向差异性大,但研究使用方法相似,因此将上述3领域研究统称为经济与管理科学领域二分类问题研究,简称二分类问题研究。以上二分类问题研究利用判别分析,取得了相对准确的理论结果,但该方法需要很强的假设和限制条件,而这些条件在实际分析屮通常得不到满足。近年来,随着人工智能学科的发展,学者引入神经网

3、络,并取得了优于判别分析法的结果。但神经网络很可能陷入局部最优,无法得到全局最优,同时它是基于经验风险最小化原理,经常出现“过拟合”现象。1995年Vapnik提出支持向量机模型(SupportVectorMachine,SVM),一种基于结构风险最小化的算法。之后学者将SVM进入上述二分类问题研究,发现其泛化能力、预测精度都高于判别分析、神经网络。近年来,为提高二分类问题研究屮SVM预测精度,学者不断探索如何改进二分类SVM,有效降低样本数据外点或噪声点、非平衡性、重叠性及错分代价差异性的影响。本文

4、结构安排如下:第一部分是引言,第二部分是考虑样本特征的改进支持向量机,第三部分是结论与展望。2改进支持向量机随着人工智能领域的快速发展,学者将传统支持向量机(C-SVM)引入二分类问题研究:Min和Lee将C-SVM引入上市公司财务困境预测,夏国恩等将C-SVM引入客户流失预测,发现C-SVM优于传统判别分析、神经网络。但此阶段仅限于对模型的简单应用,未充分考虑样本数据存在外点或噪声点、非平衡性、重叠性、错分代价差异性等。2.1外点或噪声点当数据集中存在外点或噪声点时,容易使二分类SVM结果不理想,为

5、此Liu和Huang将模糊化思想引入SVM,提出了模糊支持向量机(FSVM),根据数据点对所在类(正类、负类)的相对重耍程度,分配不同的权重,以降低外点和噪声点影响。杨海军、太雷将模糊支持向量机(FSVM)算法引入上市公司财务困境预测,对沪深两市按行业板块分类的上市公司实证分析,显示该模型预测优于C-SVMo2.2重叠性传统SVM将样本集绝对分为互斥的两类,但现实世界中这种分类不存在经济意义,即样本很可能存在重叠性,例如财务困境预测时,财务指标既定的企业,可能由于经营远离财务困境,也可能由于经营不力而

6、陷入财务困境。考虑样本数据重叠性、外点或噪声点,Wang等构建了双隶属模糊支持向量机(B-FSVM),使每个样本点依据隶属函数同时属于两类,并利用3个公开信用数据库实证分析,发现B-FSVM判别能力高于C-SVM和FSVMo阚宝奎、刘志新等[1]将R-FSVM引入上市公司虚拟财务报告识别,其中样本点对于两类样本的隶属程度确定采用谱聚类方法。研究发现,该模型的判别准确率、泛化能力都显著优于C-SVM、BP神经网络,且可以显著降低将虚假财务报告识别为真实财务报告的错误。张目、周宗放[2]采用多目标规划,减

7、少两类样本企业信用状况的重叠。基于T0PSTS法,分别以“正常企业”样本逼近理想点、“违约企业”样本逼近负理想点为目标,构建多目标规划模型;运用实码加速遗传算法求解得出指标综合权重,通过构造加权样本,减少两类样本企业信用状况的重叠,进而提高SVM预测精度。选取沪、深股市中具有“高新技术概念”上市公司作为实验样本,实证分析得出,该方法一定程度上利于两类样本的正确区分,使SVM的预测精度提高。2.3非平衡性经济与管理科学中的二分类问题数据大多存在非平衡性,而非平衡性会对C-SVM分类效果产生不利影响,即C

8、-SVM只会对数量上占优的类别具有很强的识别能力[3]。解决数据非平衡性可使用向下采样方法或构建相应模型。向下采样方法:以客户流失预测为例,从非流失客户中抽取部分样本与流失客户样本构成k:1的训练集。这种方法虽然平衡了训练集类分布,但损失了很多信息,且抽取比例、k取值确定需要多次尝试和实验。应维云、覃正等[4]考虑到流失客户和非流失客户正负样本数据不平衡,引入分类加权支持向量机算法(CW-SVM),对深圳市某银行个人信贷部的客户信贷数据分析,结果表明CW

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。