《基于数据挖掘技术的财务风险分析与预警研究 (1)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
北京聋匕工大学博士研究生学位论文日期:二。一二年六月五El 北京化工大学位论文原创性声明一攀嬲本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者签名:—赵L日期:.≯口}≥、s?/关于论文使用授权的说明学位论文作者完全了解北京化工大学有关保留和使用学位论文的规定,基S:研究生在校攻读学位期间论文工作的知识产权单位属北京化工大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。保密论文注释:本学位论文属于保密范围,在上年解密后适用本授权书。非保密论文注释:本学位论文不属于保密范围,适用本授权书。作者签名:导师签名:苏殇聋学日期:≯?二0/日瓤■■一t? 学位论文数据集中图分类号TP39学科分类号520.60论文编号1001020128106密级无学位授予单位代码10010学位授予单位名称北京化工大学作者姓名赵春学号200608106获学位专业名称控制理论与控制工程获学位专业代码081101课题来源自选课题研究方向数据挖掘论文题目基于数据挖掘技术的财务风险分析与预警研究数据挖掘,关联规则,交互挖掘,增量挖掘,关键词动态维护,风险分析,危机预警论文答辩日期2012-05—30章论文类型2学位论文评阅及答辩委员会情况姓名职称工作单位学科专长指导教师朱群雄教授北京化工大学评阅人1黄德先教授清华大学评阅人2戴亚平教授北京理工大学评阅人3评阅人4评阅人5撇员蝴黄德先教授清华大学答辩委员1戴亚平教授北京理工大学答辩委员2张朝晖教授北京科技大学答辩委员3黄克谨教授北京化工大学答辩委员4王建林教授北京化工大学答辩委员5注:一.论文类型:1.基础研究2.应用研究3.开发研究4.其它二.中图分类号在《中国图书资料分类法》查询。三.学科分类号在中华人民共和国国家标准(GB/T13745-9)《学科分类与代码》中查询。四.论文编号由单位代码和年份及学号的后四位组成。 摘要基于数据挖掘技术的财务风险分析与预警研究随着信息技术的快速发展和管理理论研究取得重大进展,信息技术在企业管理决策领域中的应用受到越来越多的关注。面对残酷的市场竞争环境,企业对风险管理的要求日益提高,如何客观评价企业管理过程中存在的财务风险,并对其进行及时预警是企业管理层始终追求的目标。传统的企业财务风险分析与预警研究方法主要包括统计分析和人工智能模型。随着企业规模的扩大和信息披露越来越频繁,统计分析模型已经不能适应海量数据分析的要求,人工智能模型没有考虑到财务数据的时间延续性。另外,企业财务风险分析与预警研究受企业内外部多种因素影响,不确定性非常高,而数据挖掘技术在不确定性理论研究中的优秀表现让两者紧密联系起来。因此,针对传统方法无法解决的问题,本文深入研究关联规则数据挖掘方法,提出了三种新的关联规则改进型算法,极大提高了数据挖掘的效率;同时,将这些算法应用于企业财务风险分析与危机预警的研究,提出了企业财务风险概念层次树模型和时间序列动态维护的财务危机预警模型。主要研究内容如下:1.基于Hash结构的关联规则交互挖掘算法HIUA现有的关联规则挖掘算法主要基于支持度.置信度框架,同一数据库在不同的支持度和置信度阈值下,算法产生的频繁项集和关联规则的数目是不同的。由于用户事先无法确定合适的支持度和置信度阈值,需要不断尝试不同的阂值才能得到理想的频繁项集和关联规则。本文针对支持度阈T 北京化工大学博士学位论文值变化时的关联规则维护问题,即当用户调整阈值时存在多次遍历数据库和重复计算问题,提出了基于Hash结构的关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构快速存取算法执行过程中得到的支持度计数,提高算法运行效率。2.基于部分支持度树的关联规则增量式更新算法IUPSMiner关联规则的挖掘算法通常假定数据库是静态的,在阈值固定的情况下,如果数据库发生变化,算法需要通过重新进行数据库扫描和计算来得到新的规则。本文针对阂值不变而数据库发生变化时的关联规则维护问题,提出了基于部分支持度树PSTree结构的关联规则增量式更新算法IUPSMiner,该算法只需对新增数据库进行挖掘,通过合并已有的和新增的部分支持度树生成新的部分支持度树,来减少对原数据库的扫描和重复计算,有效地维护了已挖掘的关联规则,提高算法的效率。3.关联规则的动态维护算法ARDM关联规则的动态维护是指当数据库和支持度阈值同时发生变化的情况下,关联规则的维护与更新问题。现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题。本文针对数据库与支持度阈值同时发生变化的情况,提出一种基于关联规则交互挖掘和增量挖掘的动态维护算法ARDM,该算法利用已有的挖掘结果进行交互挖掘和增量挖掘,即在原来的数据库中使用新的支持度阈值进行交互挖掘;然后在新增加的数据库中使用新的支持度阈值进行增量挖掘,并通过Hash结构与模式增长方法进行优化,进一步提高算法的效率。4.关联规则交互挖掘算法在企业财务风险分析中的应用 摘要企业财务风险分析的研究是通过建立财务风险指标体系,寻找指标体系中具有信任度高的规则,为企业的管理决策提供帮助。传统的财务风险分析方法通常采用统计分析模型,存在的缺点是假设条件多,无法处理海量数据。本文针对上述问题,提出了关联规则交互挖掘的方法,更加广泛的选择多个方面的财务指标,通过挖掘所有财务指标之间的规则,最终确定选择更具有代表性的财务风险指标。首先,构建财务风险分析指标体系,通过变量相关性分析进行指标筛选;然后,提出企业财务风险概念层次树模型,并采用递减支持度阈值的交互挖掘策略,寻找财务风险指标之间的’规则;最后,选择国内上市企业中的ST公司进行企业财务风险分析的实证研究,提出了影响企业财务风险的十个关键指标和防范财务风险的建议。5.时间序列动态维护挖掘算法在企业财务危机预警中的应用企业财务危机预警的研究主要是跟踪财务指标波动和变化趋势,当指标波动超出一定的范围,系统就应该发出危机预警。现有的企业财务危机预警的方法主要是基于人工智能数据挖掘模型,存在的缺点是没有考虑到财务指标数据的时间延续性。本文针对财务指标数据具有时间序列特征,●提出了基于时间序列动态维护的企业财务危机预警模型。首先,构建时间序列财务数据挖掘模型;然后,采用时间序列增量挖掘和交互挖掘策略,进行关联规则的动态维护挖掘,寻找财务指标之间的规则和预测危机企业的发展趋势;最后,选择国内上市企业中的ST公司进行财务危机预警的实证研究,提出了定性和定量进行财务危机预警的方法,并给出了危机企业不同阶段的关键指标。III 北京化工大学博士学位论文关键词:数据挖掘,关联规则,交互挖掘,增量挖掘,动态维护,时间序列、风险分析,危机预警IV 脚MTheFinancialRiskAnalysisandForewarningResearchBasedonDataMiningTechnologyABSTRACTWiththerapiddevelopmentofInformationTechnologyandsignificantimprovementofmanagementtheoryresearch,InformationTechnologyhasbeenpaidmoreandmoreattentionintheareaofenterprisemanagementdecision.Confrontingthefiercecompetitioninthemarket,theenterprisemakesincreasingrequirementsforriskmanagement,thereforehowtoevaluatetheexistingfinancialrisksobjectivelyandtimelyforewarningintheenterprisemanagementprocessbecomesthegoaltheenterpriseisalwaysseekingfor.Thetraditionalmethodsforfinancialriskanalysisandforewarningincludestatisticalanalysismethodandneuralnetworkmodel,howeverwiththeenlargementoftheenterpriseinscaleandmorefrequentinformationdisclosure,thetraditionalstatisticalanalysismethodshavebeenunabletomeettherequirementofmassivedataanalysis;alsotheneuralnetworkmodeldoesn’tconsiderthetimecontinuityoffinancialdata.Inaddition,theenterprisefinancialriskanalysisandforewarningresearchisinfluencedbyavarietyofinternalandextemalfactorswithhighuncertainty,however,theexcellentperformanceofdataminingtechnologyinuncertaintytheoreticalstudymakesthemcloselylinked.In.ordertosolvetheaboveV problemsexistedinthetraditionalmethods,afterfurtherresearchontheassociationruleminingmethods,wepresent3improvedalgorithmsbasedonnewassociationrules,whichimprovedtheminingefficiencygreatly.Inthemeanwhile,weappliedthemtotheenterprisefinancialriskanalysisandcrisisforewarningresearchandproposedbothconceptionhierarchicaltreemodelforenterprisefinancialrisksandfinancialcrisisforecastingmodelbasedontimeseries.Thepaperisorganizedasfollows.1.Hashbasedassociationruleinteractiveminingalgorithm(HIUA)Thepresentassociationrulesminingalgorithmsaremainlybasedonthesupportandconfidenceframework.Forthesamedatabase,differentsupportandconfidencethresholdwillgeneratedifferentfrequentitemsetsanddifferentnumbersofassociationrulewiththesamealgorithm.Sincetheuserscannotinadvanceknowwhichsupport—confidencethresholdisappropriate,theyneedtoconstantlytestdifferentthresholdstogettheidealfrequentitemsetsandassociationrule.Thenewalgorithmisaimedtoimprovetheassociationrulemaintenanceissueswhenthesupportthresholdischanged.Inotherwords,thepreviousalgorithminvolvesscanningthedatabasemultipletimesandrepeatedcalculationissueswhiletheusersadjustedthethreshold,SOHashbasedassociationruleinteractiveminingalgorithmHIUAisproposed,whichimprovesthepruningprocessoftheoriginalIUAalgorithmanduseHashstructuretoquicklyaccesstothesupportcountingduringtheexecution.Bythisway,thealgorithmefficiencyisimproved.VI ABSTRACT2.AssociationruleincrementalupdatingalgorithmbasedonPS—Tree(ItⅢSMiner)Ingeneral,associationruleminingalgorithmassumesthatthedatabaseisstatic,intheconditionofspecifyingfixedthreshold;itneedsre—scanthedatabasetocomputenewassociationrulesoncethedatabasehasbeenupdated.Towardstheabove-mentionedassociationrulemaintenanceissues,wepresentanefficientassociationruleincrementalupdatingalgorithmbasedonPS.——Tree(IUPS_Miner)thatonlyneedsminingthenewdatabase.BymergingtheretainedPS.——TreewiththenewPS.——Treetoreducettiecostofscanningtheoriginaldatabaseandrepeatedcalculationofassociations,itefficientlymaintainedthepreviouslydiscoveredassociationrulesandimprovedthealgorithmefficiency.3.Associationruledynamicmaintenancealgorithm(ARDM)Thedynamicmaintenanceofassociationrulesreferstothemaintenanceandupdateissuesofassociationruleswhenboththedatabaseandsupport●thresholdarechangedatthesametime.Thepresentminingmethodsusuallyhavetheproblemsthatinvolvemultiplescanningofdatabaseorrepeatedlytraversingthecomplexstructure.Inthispaper,forthesituationsthedatabaseandsupportthresholdarechangedsimultaneously,wepresentanassociationruledynamicmaintenancealgorithmbasedoninteractiveminingandincrementalmining,whichusesthealreadygeneratedassociationsforincrementalminingandinteractivemining.BasicallythealgorithmappliesVII 北京化工大学博士学位论文interactiveminingtotheoriginaldatabasesandthenappliesincrementalminingtothenewaddeddatabasesusingthenewsupportthreshold;furthermore,theefficiencyisoptimizedandimprovedwithHashstructureandpatterngrowthmethods.4TheapplicationofassociationruleinteractiveminingalgorithmsinenterprisefinancialriskanalysisTheobjectiveoftheenterprisefinancialriskresearchistoconstructingfinancialriskindexsystem,andthendeterminesthehighsupportpattemsintheindexsystemtohelpfortheenterprisemanagementdecision.Thetraditionalmethodforenterprisefinancialriskisusuallybasedonstatisticalanalysismodel,whichdrawbackismanyassumptionsSOthatitcannotprocessmassdata.Aimattheabove—mentionedproblems,associationruleinteractiveminingisproposedinthispaper,whichchoosemultiplewiderrangesoffinancialindexesfirst,andthenultimatelydeterminethemostrepresentativefinancialriskindicatorbyminingtherulesbetweenallfinancialindexes.Thedetailedstepscanrefertothefollowing:firstlyestablishfinancialriskindexsysteminwhichtheselectionoffinancialindexisbasedonvariablecorrelationanalysis;thenbuildariskconceptionhierarchicaltreetofindtherulesbetweenthefinanceriskindicatorswithinteractiveminingstrategiesofdecreasingsupportthreshold;finally,selecttheSTcompaniesinthedomesticlistedcompaniesfortheempiricalresearchofenterprisefinancialriskanalysis,andpropose10keyindicatorsthatinfluencetheenterprisefinancialriskandVIlI ABSTRACTsuggestionsforavoidingfinancialrisks.5.TheApplicationofassociationruledynamicmaintenanceminingalgorithminfinancialcrisisforecasting.Theresearchoffinancialcrisisforecastingmainlyfocusesontrackingthefinancialindexfluctuationsandtrends,andthesystemissupposedtoprovidewarningalertoncethefinancialindexfluctuatesbeyondacertainrange.Theexistingmethodsforfinancialcrisisforecastingaremainlybasedonartificialintelligencedataminingmodels,whichownthedrawbackthatdoesn’ttakethetimecontinuityofthefinancialindexdataintoaccount.Inthispaper,consideringthetimeseriescharacteristicforthefinancialindex,wepresentadynamic—maintainedenterprisefinancialcrisisforecastingmodelbasedontimeseries.Theconcretestepsrefertothefollowing:firstlyconstructthefinancialdataminingmodelbasedontimeseries;thenbasedontimeseriesincrementalminingandinteractiveminingmechanism,findtherulesbetweenthefinancialindexandpredictthe.developmenttrendforthecrisisenterprisewithassociationruledynamicmaintenancemining;finally,weselecttheSTcompaniesinthedomesticlistedcompaniesfortheempiricalresearchofenterprisefinancialcrisisforecasting,anddeterminethekeyindicatortodefinedifferentphaseofcrisisenterprise.KEYWORDS:DataMining,AssociationRules,Interactivemining,IncrementalMining,DynamicMaintenance,RiskAnalysis,CrisisForecastingIX jC京化工大学博士学位论文 目录第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.1研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.2企业财务风险分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.21.2.1企业财务风险分析的研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯31.2.2企业财务风险分析方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41.2.3存在的问题⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯51.3企业财务危机预警⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.61.3.1财务危机预警的研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯61.3.2财务危机预警的方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯71.3.3存在的问题⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯91.4本文的主要内容和结构安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.91.4.1本文的主要研究内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯91.4.2本文的结构安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.1l第二章数据挖掘技术研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯132.1数据挖掘技术的研究现状...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯l32.1.1数据挖掘的方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.132.1.2数据挖掘技术的应用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.142.2关联规则挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..:⋯⋯⋯⋯⋯⋯142.2.1频繁项集的产生⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.142.2.2规则的兴趣度度量⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.162.2.3关联规则的数据挖掘方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.162.2.4关联规则的交互挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.172.2.5关联规则的增量挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.172.2.6关联规则数据挖掘的应用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.182.3时间序列数据挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯182.3.1时间序列预测的方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.192.3.2时间序列数据挖掘的应用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.202.4动态数据挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯212.4.1动态数据挖掘的类型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.21 北京化工大学博士学位论文2.4.2动态数据挖掘的应用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.222.5小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.22第三章关联规则的动态维护算法研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯253.1关联规则的交互挖掘算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯253.1.1算法描述HIUA⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..263.1.2算法分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.283.1.3性能分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.293.2关联规则的增量挖掘算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯333.2.1利用部分支持度树挖掘关联规则⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.333.2.2基于PSTree的关联规则增量更新算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.353.2.3性能分析与算法比较⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.383.3关联规则的动态维护算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯403.3.1算法描述ARDM⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯403.3.2算法分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.423.3.3性能测试⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.433.4小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.46第四章基于关联规则交互挖掘的企业财务风险分析⋯⋯⋯⋯⋯⋯⋯⋯474.1企业财务风险分析理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯474.1.1企业风险管理理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.474.1.2企业风险分析的流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.484.1.3企业财务风险管理的理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.484.2基于关联规则交互挖掘的企业财务风险分析方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯49.4.2.1企业财务风险分析指标体系⋯_⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯504.2.2财务指标的相关性分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.534.2.3按照区间划分定义风险等级⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.544.2.4基于关联规则交互挖掘的企业财务风险分析模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.554.3企业财务风险分析实证研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯564.3.1样本企业的选取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.564.3.2财务风险指标的选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.574.3.3基于离散化属性的财务指标数据库重构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.604.3.4基于关联规则交互挖掘策略的财务风险分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.614.3.5研究结论与防范财务风险建议⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.654.4/J、结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.66 目录第五章基于时间序列动态维护的企业财务危机预警⋯⋯⋯⋯⋯⋯⋯⋯675.1企业财务危机预警理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯675.1.1财务危机预警的界定⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.685.1.2财务危机形成的路线图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.685.1.3企业财务危机预警的理论分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.695.1.4财务危机预警的流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.725.2基于时间序列动态维护的企业财务危机预警方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯745.2.1财务危机预警指标体系⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.745.2.2财务危机预警指标的等面积划分方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.765.2.3基于时间序列动态维护的企业财务危机预警模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.765.3企业财务危机预警实证研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯77‘5.3.1样本企业的选取⋯⋯⋯⋯⋯⋯⋯一:⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..775.3.2样本数据的清理与数据重构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..785.3.3企业财务危机预警指标的选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.805.3.4基于时间序列动态维护的企业财务危机预警⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.805.3.5研究结论与预测财务危机建议⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.855.4小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.89第六章结论与展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯916.1结论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.916.2工作展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.-.⋯⋯⋯⋯⋯⋯⋯⋯93参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯95致谢‘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一101研究成果及发表的学术论文⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯103作者和导师简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯105 原书空白页不缺内容 ContentsChapter1Introduction...................j............⋯.....⋯⋯...............⋯..·····.⋯········11.1Background⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.2AnalysisofEnterpriseFinancialRisk⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯21.2.1ResearchStatus⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯31.2.2AnalysisMethods⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41.2.3Problems⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.51.3WarningofEnterpriseFinancialCrisis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.61.3.1ResearchStatus⋯⋯⋯⋯⋯⋯⋯⋯⋯.j⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.6.1.3.2^压ethods⋯⋯⋯⋯⋯⋯⋯⋯一:⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯:⋯⋯⋯⋯..7’1.3.3Problems⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.91.4ResearchandThesisStructure⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..91.4.1ResearchContents⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..91.4.2ThesisStructure⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..12Chapter2DataMining⋯⋯.....⋯.......⋯..⋯⋯⋯...⋯⋯⋯....⋯........⋯........⋯⋯..132.1ResearchStateofDataMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..132.1.1Methods⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.132.1.2Applications⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.142.2AssociationRuleMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯142.2.1GenerationofFrequentItemSet⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..14‘2.2.2MeasureofRuleInterestingness⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..162.2.3Methods⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.162.2.4InteractiveMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..172.2.5IncrementalMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.172.2.6Applications⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯182.3TimeSeriesDataMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..182.3.1Method⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..192.3.2Applications⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯j⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯:!()2.4DynamicDataMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.212.4.1Classification⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..212.4.2Applications⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..22 北京化工大学博士学位论文2.5Summary........................................................................................................................22Chapter3AlgorithmforAssociationRuleMiningofDynamicMaintenance....⋯...........................................⋯......⋯⋯..................................25:;.1InteractiveMiningAlgorithmofAssociationRules⋯.⋯⋯⋯⋯.⋯...⋯⋯⋯⋯⋯.⋯....⋯.⋯.253.1.1AlgorithmDescription⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯263.1.2AlgorithmAnalysis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..283.1.3PerformanceAnalysis⋯⋯⋯...⋯..⋯⋯⋯⋯⋯⋯..⋯.⋯.⋯⋯⋯⋯.⋯..⋯.⋯⋯⋯⋯⋯.⋯⋯..293.2IncrementalMiningAlgorithmofAssociationRules⋯⋯⋯⋯.o⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯333.2.1MiningofAssociationRulesBasedonPS—Tree⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.333.2.2IncreamentalUpdatingAlgorithmofAssociationRulesBasedonPS—Tree⋯⋯.353.2.3PerformanceAnalysisandComparison⋯⋯...⋯.⋯.⋯⋯⋯......⋯.⋯⋯⋯⋯⋯....⋯⋯..383.3DynamicMaintenanceAlgorithmofAssociationRules⋯⋯....⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯403.3.1AlgorithmDescription⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.j⋯⋯.403.3.2AlgorithmAnalysis⋯⋯⋯⋯.⋯⋯..⋯⋯.⋯.⋯⋯.....⋯.⋯⋯⋯⋯.....⋯.⋯⋯⋯⋯⋯.⋯.⋯.⋯423.3.3PerformanceTest⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..433.4Summary.⋯⋯⋯⋯⋯..⋯.⋯⋯⋯⋯⋯⋯.....⋯.⋯⋯⋯⋯.....⋯.⋯⋯.⋯.⋯..⋯...⋯.⋯.⋯⋯⋯..⋯⋯⋯46Chapter4AnalysisofEnterpriseFinancialRiskbasedonInteractiveMiningofAssociationRules....⋯⋯.............⋯.....⋯⋯⋯....⋯⋯⋯....⋯....⋯.......474.1TheoryofEnterpriseFinancialRiskAnalysis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.474.1.1TheoryofEnterpriseRiskManagement⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..474.1.2ProceduresofEnterpriseRiskAnalysis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯484.1.3TheoryofEnte'rpriseFinancialRiskManagement⋯⋯⋯:⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.;.484.2AnalysisMethodofEnterpriseFinancialRiskBasedonInteractiveMiningofAssociationRules⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..494.2.1IndexSystemofEnterpriseFinancialRiskAnalysis...........................................504.2.2CorrelationAnalysisofFinancialIndex⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..534.2.3DivisionofRiskGrade.........................................................................................544.2.4AnalysisModelofEnterpriseFinancialRiskBasedonInteractiveMiningofAssociationRules.....⋯.⋯⋯⋯.⋯.⋯.⋯.⋯..⋯⋯⋯....⋯.⋯.⋯.⋯.⋯....⋯⋯.⋯⋯.⋯..⋯.⋯.⋯554.3EmpiricalStudyonEnterpriseFinancialRiskAnalysis...........................⋯..................564.3.1SampleSelectionofEnterprise⋯..⋯.⋯⋯⋯...⋯..⋯⋯⋯⋯⋯⋯.⋯.⋯⋯⋯.⋯.⋯.⋯⋯⋯564.3.2IndexSelectionofEnterpriseFinancialRisk⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.57XVI Contents4.3.3ReconstructionofFinancialIndexDataBasedonDiscreteProperties⋯⋯⋯⋯⋯604.3.4FinancialRiskAnalysisBasedonInteractiveMiningStrategyofAssociationRules⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯614.3.5SuggestionsforFinancialCrisisPrevention⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一644.4Summary⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯65Chapter5EnterpriseFinancialCrisisWarningBasedonDynamicMaintenanceofTimeSeries.....⋯......................⋯..⋯⋯..............⋯................675.1TheoryofEnterpriseFinancialCrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..675.1.1DefinitionofFinancialCrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.685.1.2RoadmapofFinancialCrisisFormation⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..685.1.3TheoreticalAnalysisofEnterpriseFinancialCrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯695.1.4ProceduresofFinancial.CrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯725.2MethodofEnterpriseFinancialCrisisWarningBasedonDynamicMaintenanceofTimeSeries⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.745.2.1IndexSystemofFinancialCrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..745.2.2EqualAreaDivisionMethodofFinancialCrisisWarningIndex⋯⋯⋯⋯⋯⋯⋯⋯765.2.3ModelofEnterpriseFinancialCrisisWarningbasedonDynamicMaintenanceofTimeSeries⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..765.3EmpiricalStudyonEnterpriseFinancialRiskAnalysis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯775.3.1SampleSelectionofEnterprise⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..775.3.2CleaningandReconstructionofSampleData⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..785.3.3IndexSelectionofEnterpriseFinancialCrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..805.3.4EnterpriseFinancialCrisisWarningBasedonDynamicMaintenanceofTimeSeries⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..805.3.5SuggestionsforPredictionofFinancialCrisis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯··855.4Summary⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯89Chapter6ConclusionsandOutlook⋯.....⋯.....⋯......⋯...⋯..⋯.⋯.....⋯.⋯⋯..916.1Conclusions⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..916.2Outlook⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯93References..........⋯.....⋯⋯.⋯⋯....⋯......................⋯....⋯..⋯⋯....⋯..⋯⋯..⋯⋯..95Acknowledgements............⋯⋯⋯⋯..⋯⋯....⋯.....⋯............⋯...................··⋯101Publications⋯⋯。⋯⋯。⋯⋯⋯⋯。.⋯⋯..⋯⋯.。⋯....⋯。。..“。⋯⋯.。⋯⋯。⋯⋯⋯⋯.103XVII 北京化工大学博士学位论文AboutAuthorandAdvisor..........⋯....⋯....⋯.......................⋯.....................105XVIll 第一章绪论1.1研究背景2007年8月美国次贷危机(SubprimeCrisis)爆发,全球金融市场动荡,大量次级抵押贷款机构破产、投资基金被迫关闭【l,2】。成立了158年的雷曼兄弟公司因过度使用金融杠杆的投机行为,于2008年9月在次债危机中破产倒闭【31。2009年12月全球三大评级公司下调希腊主权评级,希腊的债务危机爆发,随即欧洲其它国家如:西班牙、葡萄牙、比利时等也陷入危机,2011年11月意大利主权债务评级被下调,欧洲债务危机开始向欧洲核心国家蔓延【4J。后危机时代我们应该反思并积极寻找对策,从美国次贷危机到目前的欧债危机,全球金融市场对国际三大评级机构未能事先做出预警感到失望,并对评级机构的评级程序、方法和模型提出了质疑,普遍认为应该对评级行业可能潜在的利益冲突和国际三大评级机构的垄断格局应进行改革。美国次贷危机和欧洲主权债务危机给予我们的启示是国际投行和国际评级机构是靠不住的,中国需要建立自己的金融风险危机预警体系。央行行长周4')11于2011年12月25日在中国经济前瞻论坛上指出,目前评级系统对宏观经济起到了顺周期作用,造成国际经济形势的巨大波动,应减少对外部信用评级的依赖。近期国务院已批准央行作为信用评级行业的主管部门,评级体系的建设问题被作为一个重点课题交由央行进行研究。信用评级是对某个主体进行财务风险分析和危机预警,这个主体可以是一个国家,也可以是一个企业岭J。本课题将针对企业的财务风险与危机预警展开分析与研究。面‘对残酷的市场竞争环境,企业对风险管理的要求日益提高,如何客观评价企业存在的财务风险,并对其进行及时预警,需要回答如下几个方面的问题:1、企业每天都要产生大量的财务数据,什么样的方法能够快速分析这些数据?2、企业发生财务风险表现为财务指标恶化,它们之间有什么规律?哪些指标起到了关键性因素?3、企业陷入财务危机是一个渐进过程,怎么识别和区分企业所处的不同危机阶段?基于传统统计模型的分析方法,通常都有很多假设条件,计算方面过于复杂,实际应用效果并不明显,另外,面对每天都在大量产生的企业财务数据,传统的统计模型就更显的力不从心。基于现代人工智能化的危机预警模型也存在结构不稳定,限制条件多的缺点,而且人工智能的危机预警模型没有考虑财务数据的时间延续性,对样本数据的时序处理不够重视。当前,在智能工业控制领域,智能控制系统负责监控工业流程中的每一个设备的 北京化工大学博士学位论文运行状态,如果其中一个或几个设备的运行状态出现不稳定的现象,智能控制系统就会发出预警,智能控制领域发现具有信任度高的规则是的一个研究热点。同样的原理,在财务风险分析与危机预警过程中,财务的风险或预警指标就相当于工业控制系统中的设备,当指标出现波动就相当于工业设备的运行姿态出现不稳定的情况。当指标波动超出一定的范围,系统就应该发出预警,而对企业财务危机风险与危机预警的研究也相当于一个智能管理控制系统。随着数据挖掘技术的快速发展,相关理论和应用日趋成熟,数据挖掘技术无须太复杂的数学理论推理,只要通过数据筛选,就能发现数据库中隐藏的特性;并且不需要设置假设条件,只需要通过调整阈值,就能自行寻找数据中的规则。因此,将数据挖掘方法应用于企业财务风险分析和危机预警当中,建立动态的企业财务风险分析和危机预警模型,寻找具有高信任度规则,对企业存在的财务风险和危机进行及时预警就成为本课题的主要研究方向。1.2企业财务风险分析企业财务风险的概念包括广义财务风险和狭义财务风险,狭义财务风险是因举债融资而导致企业在未来无法偿还到期债务给企业财务成果带来的不确定性【6】。广义财务风险是在企业的各项财务活动中,由于各种不确定因素的影响,在一定时期内使企业财务结果与预期收益发生偏离,因而造成企业蒙受损失的机会和可能【7】。狭义财务风险主要是指企业的筹资风险,广义财务风险由于人们对它的认识不完全相同,包括的内容也不尽相同,一般包括以下内容:筹资风险、投资风险、现金流量风险、存货风险、利率风险、汇率风险等【8J。随着我国社会主义市场经济体制的建立与完善,企业管理层对财务风险分析认识.逐渐加强,对企业进行风险评估已经成为企业进行风险管理和风险控制的重要手段,并被广泛应用于经济生活的许多领域。企业进行风险管理和风险分析的意义主要有以下几个方面:l、企业财务风险分析是国家经济决策的需要我国企业的经济活动是市场经济体制下进行的,但是,国家的宏观经济调控政策起到了引导企业发展方向的作用,国家出台的每一项经济政策都直接影响企业的经营活动和经济效益。如果不考虑企业经营的实际承受力和企业资金运动的规律,仅仅依据宏观经济数据做出宏观经济调控是非常危险的,将会引起经济的大幅波动,对企业的经营活动造成严重的伤害。2010年至今国家陆续出台对房地产的调控政策,在此期间,银行业进行了若干次的压力测试,就是对银行业进行风险分析与评估,假设房地产行业整体下将30%到50%,我国的银行能否承担这样的风险,会不会出现银行业大2 第一章绪论量倒闭的现象。2、企业财务风险分析是企业贷款融资的需要企业的发展离不开贷款融资,当企业向银行或债券持有人等债权人贷款融资时,债权人要对企业的财务状况进行分析,具体包括:(1)对企业的盈利能力、现金流动性和未来发展潜力等方面评估分析。(2)对企业的资金状况、经营风险和资金周转情况等方面进行分析。(3)对企业的财务状况、资产流动状况和按期偿还债务等方面进行分析。3、企业财务风险分析是企业进行风险管理的需要企业管理层在追求企业利益最大化或股东权益最大化的同时,要承担企业发展过程中的不确定性,也就是要面对的风险。管理层需要定期编制财务报表并进行财务分析,然后做出企业下一步的发展战略,是投资扩大再生产还是收缩战线以保持稳定发展。具体包括:(1)对企业运转情况进行分析,主要通过对企业的生产经营状况、产品销售情况、资金周转情况等方面进行分析。(2)对企业的发展潜力进行分析,主要通过对企业的新产品开发能力、新市场拓展能力和企业的管理决策能力等方面进行分析。(3)对企业的偿债融资能力进行分析,主要通过对企业的偿债能力、经营现金流量和融资能力等方面进行分析。4、企业财务风险分析也是进行个人投资的需要企业与投资者的关系是利益共享、风险共担,投资者在对企业首次投资或在追加投资时需要了解企业的盈利能力、增长速度、分红能力等方面的财务信息,并对企业的财务状况进行风险评估。具体包括:(1)投资者对企业首次投资时,需要对企业的内在价值、企业发展前景和投资回报等方面进行分析。(2)投资者对企业追加投资时,需要对企业的盈利能力、增长速度等方面进行分析。(3)投资者准备转让股权,获取投资回报时,需要对企业的资产状况、所有者权益等方面进行分析。1.2.1企业财务风险分析的研究现状20世纪初,由于欧洲和美国经常爆发经济危机,政府为了加强对宏观经济运行的监控和企业风险管理的需要,开始研究和定期发布“经济晴雨表”。其中:美国哈佛大学教授珀森所编制的“哈佛指数”、巩固经济研究所编制的反映英国经济景气状况的指示器——”英国商业循环指数”、德国的经济景气研究所定期发布”德国一般商情指数 北京化工大学博士学位论文”。“经济晴雨表”成为20世纪初政府进行经济发展环境综合监测和企业风险管理的重要手段。随着战后经济的复苏与发展,人们更加关注企业经营成果和对财务风险管理绩效评价,杜邦公司利用财务比率指标之间的联系,全面评价企业风险帮助企业决策[9】o1992年COSO委员会发布《内部控制——整体框架》专题报告,1994年COSO委员会又发布了增补报告。COSO报告是一部企业风险管理与控制的立体框架,提供了一套完整的内部控制评价标准,并将风险评估、信息与沟通作为基本构成要素引入内部控制领域。针对2001年前后美国安然公司、墨克公司、世通公司、施乐公司等频发的财务信息丑闻,COSO委员会于2004年发布了全新的《企业风险管理——整合框架》(EnterpriseRiskManagement—IntegratedFramework)报告【lo】。至此,美国等西方发达国家在企业风险管理的理念、技术、方法和手段等方面已经有了一套完整的体系。我国市场经济体制的建立和发展时间较短,市场经济环境发育还不健全,随着经济全球化的发展,国内企业在市场竞争中将面对各种各样的风险,如何辨识、评估、监测、控制风险,已成为我国企业发展道路上必须面对的问题。而在我国企业风险意识不强,风险管理工作薄弱,是企业发生重大风险事件的重要原因。2006年国资委发布的《中央企业全面风险管理指引》是借鉴了发达国家有关企业风险管理的法律法规、国外先进的大公司在风险管理方面的通行做法为我国央企制定的风险管理手册,对于央企建立健全风险管理机制,促进央企稳步发展,防止国有资产流失,保护投资者利益,具有积极的意义。企业财务风险分析方法目前,财务风险分析的方法有很多种,不同的研究人员出于不同的目的已经探索出很多种控制企业财务风险的方法,从风险分析的手段来分主要包括以下几种方法:财务报表分析法、财务指标分析法、德尔菲法(专家意见法)ll¨、A(动记分法等。一、财务报表分析法财务报表分析法是根据一定的标准,通过企业各类报表资料对其财务风险进行搜索、识别、分析、判断、决策的分析方法。财务报表分析的最基本功能是将大量的报表数据转换成对特定决策有用的信息,减少决策的不确定性。财务报表分析常用的方法有比率分析法、比较分析法、因素分析法、综合分析评价方法等。应用财务报表分析方法时应注意局限性、避免孤立性、考虑可比性,需进行综合分析【l21。报表分析法主要通过企业的资产负债表、损益表、现金流量表对企业的运营能力、发展能力、盈利能力、偿债能力、资本结构、现金流量等方面进行分析【l引。财务报表分析法具有操作简便、数据来源可靠,并且比较符合企业管理人员的工作习惯和思维方式,有利于提4 第一章绪论高企业风险控制的工作效率。但是,报表分析法只适用于数据量相对较小统计分析,而对于数据量较大的财务数据显得力不从心;另外,报表分析法基本局限于财务数据的事后分析,而对于事前预测、事中控制的作用较弱,不利于企业制定计划、控制风险和管理决策。二、财务指标分析法财务指标分析法是根据企业财务、统计、业务核算资料提供的数据,对企业财务风险的相关指标数据进行计算、分析和对比,并从分析结果中搜索、识别、判断企业财务风险的技术方法。指标分析法可与报表分析法一起使用,也可单独使用,指标分析法是对报表分析的一种更进一步的研究。指标分析法要预先设定一个临界值或风险警戒线,当某一个财务指标达到警戒线时就可认定企业的经营活动存在风斛14J。财务指标分析法选择的重要财务指标包括以下几类:偿债能力:流动比率、速动比率、现金比率、利息支付倍数、股东权益比率、资产负债比率等;营运能力:存货周转率、存货周转天数、应收帐款周转率、应收帐款周转天数、流动资产周转率、流动资产周转天数等;盈利能力:毛利率、净利润率、每股收益、净资产收益率等指标;成长能力:每股收益增长率、净利润增长率、主营业务收入增长率、净资产增长率、总资产增长率、股长权益增长率等指标;现金流量比率:现金流动负债比率、经营现金净流量对销售收入比率、资产的经营现金流量回报率、经营现金净流量与净利润的比率、经营现金净流量对负债比率、现金流量比率等。企业管理者在财务指标体系设计过程中,如果缺少某项重要的财务指标就不能准确反应企业的财务状况及财务风险情况,因此,财务指标体系的完备性及指标体系的临界值设置非常重要,如果设计不好就会影响财务风险分析的结果。三、德尔菲法(专家意见法)德尔菲法又名专家意见法是由美国兰德(RAND)公司的赫尔默(Helmer)和戈登(Gordon)于1946年正式提出,并将其应用于预测中,德尔菲法的本质是一种反馈匿名征询法。德尔菲法根据对所要预测的问题采用匿名征询专家的意见的方式,然后进行整理、归纳、统计、再匿名反馈给专家,所有参加匿名征询的专家相互之问不见面讨论,不得发生任何联系,只允许与调查人员发生联系,通过如此反复多轮次调查,听取专家所提问题的看法,最后经过归纳、修改,汇总成全部参加征询专家基本一致的看法,作为预测的结果。1.2.3存在的问题综上所述,传统的财务风险分析方法主要是利用统计分析的方法对企业的财务报表数据进行分析,存在假设条件多,计算方法过于复杂的缺点,而且面对企业每天都 北京化工大学博士学位论文要产生海量数据,处理起来就显得力不从心。另外,传统的财务指标分析方法在建立指标体系时过分依赖于研究人员的喜好和主观判断,并且没有考虑到系统性风险因素的影响。随着企业对风险管理要求的目益提高,必须寻找一种方法能够高效、全面、客观的评价企业存在的风险。关联规则的交互挖掘方法能够高效处理企业每天产生的海量数据,无须经过特别复杂的数学理论推理,只要通过数据筛选,就能发现数据库中隐藏的特性;并且无需设置任何假设条件,只要通过阈值调整,就能自行寻找数据中的规则;从而达到减少人为因素影响的目的,实现对企业风险的客观评价。1.3企业财务危机预警企业财务危机预警是充分利用现代企业风险管理理论的研究成果和现代信息技术,以财务数据为基础资料,对企业日常经营管理活动中存在的财务危机信息进行收集、分析、判断,最后根据危机程度进行预警的一种技术。1.3.1财务危机预警的研究现状企业财务危机预警的研究最早起源于上世纪30年代的美国经济大萧条时期,Fitzpatrick(1932)115J运用单变量分析(SingleVariableAnalysis)对企业财务危机进行预测,他是运用单个财务指标进行预测,开创了财务危机预警实证研究的先河。60年代的美国学者阿特曼运用多变量分析模型(MultipleVariableAnalysisModel)探讨公司财务危机预警,他运用Z.score模型建立多元线性函数公式预测财务危机【l引。70年代Meyer和Pifer(1970)¨“运用线性概率模型(LineProbabilityModel,LPM)分析银行业的财务危机预警,线性概率模型是多变量分析模型的一个特例,能估计企业破产的概率,后来Laitinen(1993)t18J等学者将LPM运用于企业财务危机。随着计算机技术和人工智能技术(ArtificiallyIntelligent,AI)的不断发展和企业市场竞争环境的变化,企业需要面对多变的市场竞争环境,财务危机预警模型必须随着企业的生产经营状况和财务状况作相应的调,从而保证预警模型的判别规则适合当前的市场环境,为此,一些学者开始使用AI方法构建财务危机预警模型。例如:朱怀意、高涌(2002)将人工神经系统引入了危机预警系统,设计了核心能力战略危机预警系统,用于及时发现和预见偏差以便实施控制,保证核心能力战略的可持续性和高效性【l圳。任华、徐绪松(2003)引用模糊优选和BP神经网络,对数据分析子系统和报警子系统进行了理论推导和设计,构建危机预警指标体系【2⋯。刘恒江和陈继祥(2003)依据企业经营方向、外部环境和内部实力三维向量与战略及其效果的关联分析,建立6 战略危机预警指标及预警系统【2¨。何杰和丁智慧(2005)以寻找危机发生前的先兆为切入点,在中小企业板块建立危机预警机制‘221。1.3.2财务危机预警的方法财务危机预警的方法是随着统计学理论和信息技术的发展而发展起来的,主要有两大类:传统统计模型预警方法和人工智能专家系统预警方法。一、传统统计模型预警方法(一)单变量分析单变量分析模型是通过比较不同危机程度企业之间财务指标的明显差异,然后通过指标筛选的方式,去除一些影响不大的财务指标,并对影响较大的财务指标按照影响因子进行排序,最终确定判别能力最高的财务指标。但是,由于不同的研究人员选取的研究样本不同,结果得出的结论不尽相同。例如:Smith和Winakor(1935)提出预测财务风险能力最强的指标为营运资本与总资产【23】。Merwin(1942)提出了三对预测财务风险能力最强的指标,分别为:流动资产与流动负债、营运资本与总资产、股东权益与负债这【24】。Beaver(1966)提出总债务与总资产、现金流与总负债、净收入与总资产这三对指标预测财务风险能力最高【25I。(二)多变量模型分析多变量模型分析是指使用多个变量组成的判别函数来预测企业财务危机的多元线性判定模型,美国学者阿特曼Altmen(1968)运用多变量分析模型进行财务失败的预测。并针对不同类型的企业建立了z分数模型系列,包括:Z.Score模型、Z’.Score模型、z”.Score模型等【16】。彭素欣(2008)【26】运用Z.Score进行了上市公司财务风险预警研究。Z.score模型的公式(1—1)如下:Z=I.2Xl+1.4X2+3.3X3+O.67-.4+1.0X5(1-1)其中:z为判别函数值,X1_(流动资产一流动负债)/(固定资产+流动资产+’投资)=营运资产/总资产,X2=累积储备金/(固定资产+流动资产+投资)=留存收益/总资产,X3=(销售收入一生产成本)/(固定资产+流动资产+投资)=税利前利润/总资产,X4=权益市场价值/债务账面总价值,X5=(销售量誊销售价格)/(固定资产+流动资产+投资)=销售收入/总资产。z值越低则企业越有可能破产,当Z>2.99时表明企业财务状况良好,当Z值<1.81时表明企业处于破产区。(三)罗吉斯(Lo西stie)回归模型多变量分析只能区分破产企业和非破产企业,而对于企业在未来几年中可能破产的概率无法进行判断,Logistic回归的方法可以比较好的在这方面进行研裂271。Martin(1977)【2引最早使用Logistic回归模型应用于银行系统进行财务危机的预测研究,影响范围最广的研究是Ohlson(1980)[29]的财务危机预测模型,研究样本区间为美国上市企业197旺1977年的财务数据,从中筛选出105家已经破产的企业和2058家正常 北京化工大学博士学位论文经营的企业,从所有财务比率中筛选出9个财务指标,建立了3年的预测模型,研究得出4个最有代表性的企业财务危机指标,分别为:财务结构、流动性、企业规模、经营绩效。在Logistic回归模型中,假设第i家公司的预测变量为Xi,a和B为待估计参数,通过模型预测第i家公司破产的概率可以用如下公式(1.2)表示:P(Xi,p)=F(0【+pXi)(1—2)其中:F(ot+J3Xi)是累积对数函数,且F(叶DXi)=1/(1+e-(时BXi))(1.3)或者ln(P/(1一P))=仅+pXi.(1-4)假设危机样本为x1¨’,X2‘1’,⋯Xm¨’,正常样本为Xl‘2’,X2‘2’,⋯Xm∽’,则似然函数为:m脚=啦矗丽域一高最大化对数似然函数ln[L(ot,p)]就可得到上式中的参数伐和p,该模型可以计算出公司进入财务危机的概率P(Xi,D)。国内学者宁静鞭(2008)t30J通过比较Logistic回归方法和K近邻方法的预测效果发现:Logistic回归短期内的预测精度高,而K近邻方法长期预测精确度高。二、人工智能专家系统预警方法(一)神经网络模型(NeuralNetwork,NN)神经网络模型是一种自然的非线性建模过程,具有模拟人的部分形象思维的能力【3l】。神经网络模型的结构由三层构成:输入层、隐藏层、输出层。.输入层用于接受外部环境输入的信息,隐藏层处在输入层与输出层中间,隐藏层负责学习和内部运算,输出层用于接受隐藏层的信息,并将数据传递给外部环境。国内部分学者利用神经网·络模型构建了危机预警模型,例如:吴应宇等人基于财务视角和非财务视角,利用主成分分析和神经网络技术相结合,建立的企业财务危机识别系统【321。李铭等人构建具有智能综合评价性质的BP神经网络危机预警模型,克服了人为确定权重的困难及模糊性和随机性的影响【3引。(二)遗传算法模型(GeneticAlgorithm,GA)遗传算法模型是通过模仿遗传进化规律,在大量复杂概念空问内随机搜索的技术【341。利用遗传算法模型对企业破产进行预测是基于多个方面约束的参数优化,可将财务指标的比率值和定性变量进行条件判别并提取规则,结构清楚容易理解【35I。李清(2010)t36】进行了基于适度财务指标和遗传算法的财务危机预测模型研究。(三)支持向量机模型(SupportVectorMachine,SVM)支持向量机是上世纪九十年代中期发展起来的新的机器学习技术,是以统计学习 第一章绪论理论SLT为基础的一种新的统计研究方法。许多专家应用支持向量机模型研究银行破产的预警问题,并将研究结果与统计方法模型和神经网络模型的预测结果进行比较,证明这种方法的预测效果较好。它克服传统神经网络的一些缺陷,采用结构风险最小化的原则,给出全局最优解和不会产生过度拟合的现象。国内也有学者使用支持向量机构建了企业破产预测模型,杨毓、蒙肖莲考察了取不同参数时支持向量机模型性能的变化‘371。(四)案例推理的财务危机预警方法案例推理的财务危机预警方法是一种基于案例推理的财务预警分析方法,它是运用K临近算法以存储案例进行分类,通过此方法对新增案例进行推理、判别和预测。孙伟等运用案例推理技术和平衡计分法构建一个完整的包括预警和排警的财务预警体系,提出应用平衡记分法来建立企业的财务预警指标,提高预警的精度【38】。案例推理的财务危机预警方法与人工智能专家预警系统其他方法比较研究结果表明,案例推理在数据不充分的条件下使用更好,它的优点是能在复杂变化的环境中解决问题和进行决策,缺点是可应用的样本少且要与其他预测方法结合使用。1.3.3存在的问题综上所述,现有企业财务危机预警模型都是静态的挖掘模型,存在的不足之处主要表现为三个方面的问题:一是运用人工智能的方法存在限制条件多,结构不固定的缺点;二是运用危机征兆分析方法,割裂了定性分析和定量分析,影响了预测结果的准确性;三是运用危机预警指标的方法,指标体系的建立要具有针对性和覆盖性,而且计算比较复杂和繁琐。面对激烈的市场竞争环境,传统的静态挖掘模型已经不能适应企业危机预警的要求,必须建立动态数据挖掘的企业财务危机预警系统,主要是因为企业财务的数据每天都在源源不断的产生,并且都带有时间特征。建立时间序列的动态维护财务预警模型就显得非常有必要,能及时分析企业财务危机程度,而且能够对企业未来发展方向做出预判,帮助管理者制定适当的企业发展战略。1.4本文的主要内容和结构安排1.4.1本文的主要研究内容随着我国资本市场的快速发展,企业对风险管理的要求日益提高,如何客观评价企业管理过程中存在的财务风险并进行及时预警,已经成为一个研究热点和难点。针 北京化工大学博士学位论文对传统统计分析方法存在的假设条件多,无法处理海量数据的问题;另外,人工智能的方法没有考虑财务指标的时间延续性无法跟踪财务指标的波动和变化趋势等问题。本文提出运用关联规则动态维护的方法进行企业财务风险分析与危机预警研究,首先提出了关联规则的三种改进型算法,极大的提高了算法的效率,为进一步的应用研究提供了技术保证。在应用研究中将关联规则交互挖掘算法应用于企业财务风险分析,并将关联规则的动态维护算法应用于企业财务危机预警。主要研究内容如下:1.关联规则的三种改进型挖掘算法本文提出了关联规则的三种改进型挖掘算法,第一,提出了基于Hash结构的关联规则交互挖掘算法HIUA,它是针对支持度阈值变化时的关联规则维护问题,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。第二,提出了基于部分支持度树的关联规则增量式更新算法IUPSMiner,该算法利用部分支持度树的结构提出了对关联规则的增量式更新算法,主要用于解决向数据库中添加新的数据而最小支持度不发生变化时的关联规则更新问题。该算法有效地利用已挖掘的关联规则和保留的部分支持度树来改善性能,并且只需对新增数据库部分进行一遍扫描,从而进一步提高算法的效率。第三,提出了关联规则的动态维护算法ARDM,它主要应用于数据库和阈值同时发生变化的情况。现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题,该算法是基于IUA与FUP算法,提出数据库与支持度阈值同时变化情况下的关联规则维护算法,并通过Hash结构与模式增长方法进行优化。2.关联规则交互挖掘算法在企业财务风险分析中的应用企业财务风险分析的方法包括定量分析和定性分析两个方面,定量分析方法的核心是建立风险分析指标体系和风险分析模型。以前学者在进行财务风险分析时通常采用传统的统计分析的方法,取得了一定的研究成果。本文采用关联规则交互挖掘的方法,更加广泛的选择多个方面的财务指标,通过挖掘所有财务指标之间的规则,最终确定选择更具有代表性的财务风险指标,与传统分析方法相比更加具有客观性和现实‘应用意义。首先,建立企业财务风险分析管理体系和风险分析流程,第二,建立企业财务风险分析指标体系,并运用变量相关系数分析方法,剔除其中部分相关度较高的风险指标。按照区间划分定义财务指标风险等级,将所有财务指标划分为五个等级,并对原有的数据集进行重构,转化为适合关联规则挖掘的离散型数据集。第三,提出了基于关联规则交互挖掘算法的企业财务风险分析模型,主要包括构建多层次的风险概念树,并采用递减支持阈值的交互挖掘策略,寻找财务风险指标之间的规则。最后,选择国内上市企业中的ST公司进行企业财务风险分析的实证研究,提出了影响企业财务风险的十个关键性指标,并通过实际数据分析和测试,关键指标的波动严重影响并决定企业的风险程度。3.动态维护挖掘算法在企业财务危机预警中的应用 第一章绪论企业财务危机预警的理论是一个包含多学科的综合性理论,它是一个涵盖企业风险管理、工业过程控制、动态信息技术、数理建模等多学科的知识。企业财务危机预警的研究与智能工业控制系统中挖掘具有信任度高的规则的研究非常相似,财务危机预警指标就相当于工业控制系统中的设备,当指标出现波动就相当于工业设备的运行姿态出现不稳定的情况,财务指标波动超出一定的范围,系统就应该发出预警。首先,建立企业财务危机预警理论体系,主要包括:企业财务危机的界定、财务危机形成的路线图、企业生命周期理论、财务危机的发展趋势分析和企业财务危机的预警程序。第二,建立企业财务危机预警指标体系,危机预警指标体系不仅包括财务风险分析指标,还增加了企业治理结构指标,并利用连续数据正态分布进行等面积划分,按照危机企业的发展步骤将原有财务数据划分为五个等级,然后进行财务指标数据重构得到适合数据挖掘的数据集。第三,提出了基于时间序列动态维护的企业财务危机预警模型,主要包括构建时间序列财务数据挖掘方法,采用时间序列增量挖掘和交互挖掘机制,进行关联规则的动态维护挖掘,寻找财务指标之间的规则和预测危机企业的发展趋势。最后,选择国内上市企业中的ST公司进行两种发展趋势危机预警的实证研究,通过规则筛选,提出了危机预警的两种方法,一种为定性分析的方法,根据规则的发展趋势判断企业的危机程度,另一种为综合因素定量分析的方法。1.4.2本文的结构安排本文总共分六个部分,整体结构如下:第一章绪论部分,介绍了本文的研究背景及意义,介绍了企业财务风险分析与危机预警的研究现状和方法,最后给出了本文的主要研究内容。第二章介绍了数据挖掘技术的研究现状,重点介绍了关联规则的数据挖掘现状与挖掘方法,另外,‘还介绍了基于时间序列的数据挖掘方法。第三章重点分析现有的四种关联规则经典算法,提出了三种新的关联规则改进算法:基于Hash结构的关联规则交互挖掘算法HIUA、基于部分支持度树的关联规则增量式更新算法IUPSMiner和关联规则的动态维护算法ARDM。第四章提出了基于关联规则交互挖掘的企业财务风险分析方法,将关联规则的数据挖掘技术应用于企业财务风险的分析。建立基于交互挖掘的企业财务风险分析模型,构建了多层次的企业财务风险概念树,采用递减支持阈值的交互挖掘策略,寻找财务指标之间的规则。第五章提出了基于时间序列动态维护的企业财务危机预警方法,将关联规则的动态维护挖掘技术应用于危机预警的研究。建立基于时间序列动态维护的危机预警模型,采用时间序列增量挖掘和交互挖掘策略,寻找财务指标之间的规则,并对危机企业的发展趋势进行预测。 jC京化工大学博士学位论文最后一章对论文工作做出总结并提出了进一步的研究设想。 一.第二章数据挖掘技术研究现状————————————————————————————————————————————一一第二章数据挖掘技术研究现状数据挖掘(DataMining)3L被称为知识发现,是从数据库中发现规则的过程【39421。数据挖掘的思想起源于统计学,是统计学、数据库技术和人工智能技术等理论和技术的综合,数据挖掘的发展得益于高性能(并行)计算技术和分布式技术在处理海量数据集方面的优秀表现【43,441。数据挖掘技术的进步与发展为本文研究提供了很好的技术支持,本章将重点介绍数据挖掘技术的最新研究现状。2.1数据挖掘技术的研究现状数据挖掘技术是一项比较年轻的技术,1989年8月在美国底特律召开的第十一届国际人工智能联合会议IJCAI中,举行了世界上第一次关于数据库中的知识发现专题讨论,1991年一1994年每年召开一次关于KDD(KnowledgeDiscoveryinDatabases)的讨论专题。第一届关于知识发现与数据挖掘国际学术会议于1995年在加拿大蒙特利尔召开。随后几年有关数据挖掘方面的会议和期刊逐渐增多,例如:JournalofDataMiningandKnowledgeDiscovery(1997)、1998ACMSIGKDD会议以及SIGKDDExplorations等。目前,数据挖掘逐渐成为许多知名国际学术会议和期刊关注的焦点,主要包括:PAKDD,PKDD,TKDD,SIAM.DataMining,(IEEE)ICDM,数据仓储与知识发现(DataW2urehousingandKnowledgeDiscovery),SPIE.DM等等。2.1.1数据挖掘的方法数据挖掘首先要对数据进行清理,去除其中的异常数据,然后对数据进行选择和集成,再通过数据变换将数据转变为适合数据挖掘的类型,最重要的一步是选择合适的数据挖掘方法寻找数据中的规则,最后通过模式评估和知识表示将数据中隐藏的模式和规律展示出来。数据挖掘的方法主要包括以下几种:1.分类和预测(ClassificationandPrediction):分类挖掘是将大量数据按照建立的模型进行区分的方法,可以将数据分成多个类别;预测是通过建立连续值函数模型,对未来的数据的发展趋势进行预测的一种方法。2.聚类(Clustering):聚类挖掘是根据一个待分析的数据对象集,按照实例属性值的相似程度自动汇聚成不同的类别。 北京化工大学博士学位论文3.关联规则(AssociationRules):关联规则挖掘是用于发现隐藏在事务数据集或关系数据集中对用户有用的或有意义的联系。4.时间序列(Time.Series):时间序列挖掘是对不同时间重复测量得到的值或事件的序列对象进行挖掘,期望对数据的趋势性变化进行分析的方法。5.其他方法:针对复杂数据类型如:图形图像,视频,Web等进行的挖掘。2.1.2数据挖掘技术的应用目前,国外有一些公司利用数据挖掘技术在相关产品基础上开发的特定的应用,如:IBMIntelligentMiner、SASEnterpriseMiner。数据挖掘技术在国内大部分处于科研阶段,例如各大学和科研机构从事数据挖掘算法的研究、数据挖掘讨论组(www.dmgroup.org.cn)等;国内关于数据挖掘方面的著作相对较少,主要是翻译国外的相关书籍;拥有自主知识产权的数据挖掘软件有复旦德门(Ⅵn^眦datamining.com.cn)等。经过二十几年的快速发展,数据挖掘已经从实验室研究走向实际的应用,在所有这些数据挖掘方法中关联规则的挖掘是最活跃和应用最广的方法。本文主要针对关联规则的数据挖掘方法展开进一步的研究,并将其应用于企业财务风险分析与危机预警当中,另外,还应用到时间序列数据挖掘和动态挖掘的一些方法。为此,将分别对这些方法的研究现状做简单介绍。2.2关联规则挖掘关联规则挖掘(AssociationRulesMining)是为了寻找同一事件中不同项之间相关性【45,461。采用的挖掘策略包括两个方面的内容:(1)频繁项集的产生:寻找满足最小支持度阈值的所有频繁项集(FrequentItemset)。(2)规则的产生:从频繁项集中提取具有高置信度的规则,这些规则称作强规则(StrongRules)。2.2.1频繁项集的产生格结构(LatticeStructure)常常被用来枚举所有可能的项集,一般来说,一个包含d个不同项的数据集可能产生2d个频繁项集。同时可能产生R条规则,R可以用如下公式表示:14 第二章数据挖掘技术研究现状R=喜l(老)×篁j=lfk.d—J尼)l=34—24“+tc2一·,发现频繁项集的一种原始方法是确定格结构中每个候选项集(candidateintesetl的支持度计数。通常我们可以通过减少候选项集的数目和减少支持度的比较次数达到降低产生频繁项集的计算复杂程度。这里有一个先验原理有必要先做一个介绍,就是如果存在一个项集是频繁模的,则它的所有子集也一定是频繁的[47-50】。假定{C,d,e)是频繁项集,显而易见,任何包含项集{c,d,e)的事务一定包含它的子集{c,d){C,e){d,e){C){d)和{e),则它的所有子集(图1.1中的阴影项集)一定也是频繁的。图1.1是项集格先验原理的示意图。图1-1项集格先验原理的示意图假定项集{a,b)是非频繁的,则整个包含{a,b)超集的子图可以被立即剪技。这种基于支持度度量修剪指数搜索空间的策略称为基于支持度的剪技(Support-BasedPruning)。图1.2基于支持度的剪技示意图:’图1-2基于支持度的剪技示意图 北京化工大学博士学位论文2.2.2规则的兴趣度度量(1)设I={il,i2⋯.,im)是所有项的集合,如果XGI则称X是一个项集(ItemSet)或模式(pattem),如果x中有k个元素,则称x为k项集。(2)假定数据D是事务数据库的集合,其中每个事务T则是项的集合,每个事务由事务标识符TID标识。(3)A,B为两个项集,且A∈I,B至I,ANB=①,事务T包含A当且仅当A∈T则关联规则是如下蕴涵式:AjB[S,C]。支持度表示在数据库D中同时出现A和B的概率,支持度具有一定的统计意义;置信度表示出现A时,同时又出现B的概率,置信度表示规则的强度。我们可以用条件概率公式计算支持度和置信度的值。support(AjB)=P(AUB)confidence(A≥B)=P(B/A)=P(AUB)/P(A)‘例1:关联规则挖掘方法表2-1数据集交易ID购买商品1A,B,C2A,C3A.D.4B,E,F表2-2频繁项集的支持度频繁项集支持度{A)75%(3){B)50%(2){C)50%(2){D)50%(2)假设:最小支持度50%(2),最小置信度60%,对于A≥C:support2support({AC}1=50%confidence=stipport({AC})/support({A}1=66.7%2.2.3关联规则的数据挖掘方法1.基于候选模式生成与测试(CandidateGenerationandTest)的方法ApriofiDl]算法由Agrawal等提出,首先确立了支持度.置信度框架,它的基本方法是通过迭代生成所有长度的频繁模式集。首先对数据库扫描生成候选1.项集C.,之后利用Apfiofi性质的反单调性进行支持度计数比较后剪枝,产生频繁1.项集L1,频繁1一项集与自身链接生成候选2一项集C2,再比较再剪枝,如此进行下去,得到所有长度为k(k≥1)的频繁项集Lk,直至不再产生新的频繁项集为止【52。55】。 第二章数据挖掘技术研究现状2..基于模式增长(PattemGrowth)的方法由于基于候选模式的算法会产生大量的候选模式集,并且需要对数据库频繁扫描,导致了在数据集稠密或支持度阈值较低时算法性能的下降,因此JiaweiHan等人提出了基于模式增长(FrequentPatternGrowth)的FP—Growth算法【561。该算法引入了扩展的前缀树结构(FrequentPatternsTree)来保存数据集信息,构建FP.tree只需扫描数据集两次,并且每一条根到叶的路径中节点的频繁程度递减,使得树结构更加紧凑,且有利于模式生成算法中对FP.Tree的拆分[57】。例:如果“abcdef’是频繁集,当且仅当“abcde,,是频繁集,且“f”在包含“abcde”的事务中是频繁的。2.2.4关联规则的交互挖掘关联规则的交互挖掘(InteractiveMining)是由于用户事先并不知道什么样的最小支持度和最小置信度阈值是合适的,因此需要不断调整两个阈值的大小,才能得到用户满意的的关联规则挖掘问题。主要包括以下两种方法:(1)基于候选项生成与测试的交互挖掘方法基于候选项生成与测试的交互挖掘方法都是基于Apriori框架,此类算法都是利用已经挖掘出来的关联规则,来尽量减少候选项集的个数,从而减少到整个数据库中去测试【58J。主要方法如IUA(IncrementalUpdatingAlgorithm)和NewlUA(NewIncrementalUpdatingAlgorithm)[59】等。在关联规则交互挖掘过程中,最小支持度和最小置信度这两个阈值需要不断调整,才能挖掘出真正有效的关联规则。当数据库不变,这两个阈值变化时,存在着关联规则的更新问题,增量式更新算法IUA就是利用已发现的频繁项集发现新的频繁项集。IUA算法不足之处是由于先将频繁项集划分为两个不相交子集,再通过两个子集拼接而成,那么在拼接后就会产生大量的无用候选集;另外其修剪步将会误删掉一些频繁项集。(2)基于模式增长的交互挖掘方法该算法是为了减少重复构建频繁模式树和重复扫描数据库,充分利用已有的关联规则进行挖掘,达到提高算法的效率。例如:Ma等人提出当阈值发生变化时在先前发现的频繁模式下有效延长和重新挖掘的更新算法Re.mining【60】。Cong等人提出了一个压缩策略以适应现有的三个频繁模式挖掘技术,并有效利用已有的压缩数据库算法Recycling[6¨。2.2.5关联规则的增量挖掘关联规则的增量挖掘(IncrementalMillin曲是指当数据库变化时,关联规则的维护 和更新问题。主要包括以下两种方法:(1)基于候选项生成与测试的增量挖掘方法这类算法都是基于Apriori算法的,尽可能的利用已经挖掘出来的关联规则。当发生数据库改变时,通过对新增数据库的扫描,来尽可能地减少那些需要到原始数据库上去测试的候选集,再通过迭代的方法生成频繁项集。例如Cheung等人提出了FUP(Fastupdate)算法,对新增数据进行挖掘[6扪。其它的增量挖掘算法还有FUP2【63】,DELIt“1等。(2)基于模式增长的增量挖掘方法这些算法都是基于分而治之的模式增长框架,充分利用已经挖掘出来的关联规则挖掘。例如:杨秀金等人提出了基于频繁模式表(FPL),可以处理数据库数据增加和最小支持度都发生改变的情况下关联规则的维护算法UFPL(UpdateFrequentPatternList)t651。王佐成等人利用以往大量关联规则作为种子规则提出了算法RGA(RuleGrowingAlgorithm)t661;邹力鹃等人提出一种快速算法FIAFAR(FastIncrementalAlgorithmtoFindAssociationRules),该算法使用CAN.树存储原始交易数据库,弥补了FP.树的不足【6川。2.2.6关联规则数据挖掘的应用随着关联规则挖掘技术的逐步成熟,许多企业已经开发出很多在特定产品上的应用,例如在商品零售领域,关联规则挖掘技术已经被广泛应用。在金融领域,美国银行家协会(ABA)预测数据仓库和数据挖掘技术在美国商业银行的应用增长率大致为15%。还可以使用数据挖掘技术分析客户使用分销渠道的情况和分销渠道的容量,其它的一些应用包括建立利润评测模型和风险控制等。在电子商务领域,使用关联规则挖掘在网上进行商品推荐,或建立个性化网页等。在生物制药、基因研究领域,使用数据挖掘技术进行DNA序列查询和匹配,还可对基因序列的共发生性进行识别。2.3时间序列数据挖掘时间序列数据挖掘(TimeSeriesDataMining)是通过分析数据的时间特性,深入研究事物发展的推进过程,从具有时间特征的数据中获得知识的方法。就是要从大量的时间序列数据中提取潜在的、不为人事先预知的,同时与时间特性紧密相连的规则,并可被应用于对时间数据的短期、中期或长期的发展趋势进行预测【681。 第二章数据挖掘技术研究现状2.3.1时间序列预测的方法时问序列是指在不同时间点上取得的某个变量指标数值,按照时问先后顺序排列而成的数据列表。在我们日常生活中存在多种时间序列数据,例如:超市销售商品的销售量数据为一元时间序列数据,气象台每天发布的天气预报数据为多元时间序列数据,金融市场中的股票价格波动为连续型时间序列数据,工程控制领域中的脉冲控制数据为离散型时间序列数据。假设我们对某一事件发展过程中的变量进行进行观察并测量其数据记为Y。,经过一系列的时刻tl,tz,⋯,tn(t为自变量,且hrchildp=MergePS_Tree(p,g)r->r.child=pelseI—pq=q->r.childp=MergePSjtee(p,前r->r.child=pelseif((p.child--=NULLandq.child!=NULL)P.child=qelse『p->r.childq=q·>r.child『MergePSjtee(p小returnPS3t皖DendMergePS_Tree算法采用以深度优先的顺序来合并PS_TreeD禾DPSTreed+。实验表明,和重新扫描数据库构建新的部分支持度树的时间相比,当有新的数据D+插入时,合并算法消耗的时间是非常少的,特别是当插入的数据D+的元组数占原始数据的元组数比例较小时,该合并算法的效率更加明显。用MergePS_Tree将图3—10和图3-11的部分支持度树合并成一棵新的部分支持度树PSJreeD,。图3—12是合并后的部分支持度树PSTreeD7。 北京化工大学博士学位论文1l:,一』2:j}._2r’7冬妻—一、/。3秀多。。/3.:|:2囊一"k---盘裂1.一?l7I|⋯一一”‘”’“13:3_厶:::1一/5:1;、IjI』j童。∥’麓鬻-{;¨j冬翟。一受曼j爹图3.12合并后的部分支持唐树PSTreeD,3.2.3性能分析与算法比较对于本文所考虑的关联规则增量式更新问题,最具影响力的算法是FUP,而FPGrowth是不采用增量更新来挖掘关联规则的快速算法。现在就将IUPSMiner与这两个算法进行性能比较。用VisualC++6.0在内存为DDR512M、CPU为P42.4G的PC,在Windows2000Server环境下实现以上3个算法,采用了一组合成数据T40110D100K和一个实例数据CHESS.DAT,分别用D1和D2来描述它。三种算法在这2个数据中的比较结果如下图所示。图3.13是s=1.00%使用T40110D100K对3个算法性能比较;图3.14是s=1.50%使用T40110D100K对3个算法性能比较;图3.15是s=20%使用CHESS对3个算法性能比较;图3.16是s=30%使用CHESS对3个算法性能比较。|D+I/(1Dl+ID+1)图3-13使用T40110D100K,s=1.00%三种算法的性能比较图3.14使用T40110D100K,s=1.50%三种算法性能比较38 第三章动态维护的关联规则算法研究图3.15使用CHESS,s-20%三种算法性能比较图3.16使用CHESS,s-30%三种算法性能比较就数据D,采用了两个不同的固定最小支持度(分别为1.00%和1.50%),由于数据库CHESS是包含较长频繁项集的数据库,采用较高的最小支持度(20%和30%)来对算法进行比较。图3.15和图3.16表明了支持度不变的时候,当插入新的数据库时,算法IUPSMiner获得了很好的性能。事实上,由于IUPSMiner采用了非Apriori性质的策略(深度优先)来生成频繁项集,没有产生大量的候选项,从而算法的效率必然比采用Apriori的FUP算法来得要高。另外一方面,因为采用PSTree的结构,减少了大量的I/O操作,当数据可以常驻内存的时候,更新算法中只需对更新的数据库进行一次扫描即可,时间消耗也必然比重新运行一次FPGrowth要来得少,特别是当添加的数据和更新后的数据库相比相对较小((ID+I/(IDl+ID+1)比较小)的时候,IUPS—Miner的优势尤为明显。本文就关联规则的增量式更新问题进行了探讨,提出了基于PSTree的高效增量式更新算法IUPSMiner,以处理最小支持度不变而添加了新的事务数据库时的关联规则更新问题。理论与实验结果表明,该算法具有较好的性能。如何将本文所提方法应用于添加和删除数据库的同时允许修改最小支持度S的关联规则增量更新问题,即关联规则的动态维护算法将是下一节的重点研究内容。39 北京化工大学博士学位论文3.3关联规则的动态维护算法提高算法效率是关联规则研究的重要内容,而在数据库和支持度阈值同时变化的情况下,利用已有的信息进行增量挖掘和交互挖掘是提高算法效率的有效手段。在不同的支持度阈值和不同的置信度阈值下,算法产生的频繁模式以及关联规则的数目是不同的,由于用户事先不知道合适的支持度以及置信度阈值,因此用户可能需要不断的尝试不同的阈值才能得到理想的频繁模式和关联规则【391。针对支持度阈值变化的情况,冯玉材等人利用已经挖掘的信息,提出IUA算法,该算法是基于Apfiofi算法的。另外由于数据库通常都是不断更新的,所以针对数据库规模增长的情况,DavidW.Cheung等充分利用了以挖掘的信息,提出FUP算法。增量挖掘算法还包括UWEP[86】算法,以及之后出现的FUFP—tree【87】、IFP.Gro吼h【88,89]、TTF和PTF[901等上述算法的改进算法,但它们均没有考虑数据库和支持度阈值同时变化的情况。‘同时,随着数据仓库与数据挖掘技术的不断发展,借助关联规则挖掘辅助分析人员进行财务分析逐渐成为了可能,近年来,不断有学者将关联规则挖掘应用于股票数据分析预测【911,以及财务指标之间的关联分析等【8们。目前大部分关联规则算法均基于支持度.置信度框架,方法包括以Apfiofi为代表的基于候选模式生成与测试的算法,和FP.Growth以为代表的基于模式增长的算法。本文鉴于以上两种算法无法解决数据库规模增长与支持度阈值变化同时发生的情况,基于IUA与FUP算法,提出一种关联规则动态维护算法ARDM(AssociationRulesDynamicMaintenance),并对该算法在财务指标与财务比率分析中的应用作了研究。3.3。1算法描述ARDM:设SptThr为支持度阈值,CfdThr为置信度阂值,DS为新数据集,DSInc为新数据集与原数据集的差,即增量数据集,Ptni为长度为i的模式,Ptni.Cnt为长度为i的模式在相应数据集中的支持度计数,Ci、Li分别为长度为i的候选模式集、频繁模式集,LBase为原数据集频繁模式集,Llnc为增量数据集频繁模式集,LOrg为原支持度下频繁模式集,LNew为由LNewl的模式集生成的频繁模式集,Rules为规则集。(1)IUA_Oen输入:模式长度k,LOrg,LNew输出:Lk3IUA_Gen(k,LOrg,LNew){for(i=1tok){foreachPtniinLOrgi{ foreachPtnk.iinLNewk_i{Ck.Add(Concat(Ptni,Ptnk-O);)returnselectPtnksfromCkwhereeachPtnk.1inPtnkexistinLk-l;)(2)IUA_GenLk输入:模式长度k,LOrg,LNew,L,DS,SptThr输出:LkIUAGenLk(k,LOrg,LNew,L,DS,SptThr){Lkl:selectPtnksfromApriori_Gen(LOrgk-0wherePtnkisnotinLOrgkandPtnk·CminDS>=SptThr;L0:selectPtnksfromApriori_Gen(LNewkq)wherePtnk.CntinDS>=SptThr;Lk3=IUA_Gen(k,LOrg,LNew);retumUnion(Lkl,砰,Lk3);)(3)IUAwithHash输入:LOrg,DS,SptThr输出:新支持度下LIUAwithHash(LOrg,DS,SptThr){L1:SelectPtnlfromDSwherePtnl.Cnt>=SptThr;LNewl=L1-LOrgt;f.or(k=2;Lkqisnotnull;k++){Lk=IUA_GenLk(k,LOrg,LNew,L,DS,SptThr);)retumUnion(Ll,L2,...,Lk);)(4)FUPwithFP—Growth输入:LBase,DSInc,SptThr输出:新数据集下LFUPwithFP.Growth(LBase,DSInc,SptThr){Line=FP.Growth(DSInc,SptThr);L1=Intersect(LBase,Line);L2:selectPtnsfromLBase.L1where(Ptn.CntinDSBase)+(Ptn·CntinDshc)>241 北京化工大学博士学位论文SptThrL3=selectProsfromLInc.L1where(Ptn.CntinDSBase)+(Ptn.CntinDSInc)>=SptThrreturnUnion(L1,c2,L3);)(5)ARDM输入:SptThr,CfdThr,DSInc输出:新数据集下L、RulesARDM(SptTI'n-,CfdThr,DSInc){if(SptThrchanged){if(SptThrwentup){L=selectPtnsfromLwherePtn.Support>=SptThr;)’else{L=IUAwithHash(L,DSBase,SptThr);)if(DSlncisnotnull){L=FUPwithFP-Growth(L,DSInc,SptThr);)if(SptThrchangedIICfdThrchangedllDSsiz.eincreased){if(CfdThrwentup&&SptThrdidn’tchange&&DSsizedidn’tchange){Rules=selectRulesfromRuleswhereRule.Cfd>=CfdThr;>.else{Rules2GenerateRules(L,CfdThr);)retumL,Rules;)3.3。2算法分析(1)IUA_Gen算法分为拼接和修剪两个步骤,首先通过对LOrg中的LOrgi与LNew中的LNewk-i进行拼接,然后对于每个Ptnk,如果它的任意Ptnk-1均属于Lk-1则将它添42 第三章动态维护的关联规则算法研究加至Lk3。.(2)IUA—GenLk算法基于观察l,对于ckl,ck2直接使用ApfiofiGen函数生成,并由CkI剪切生成Lkl,Lk3由IUA—Gen生成,并返回LkluLk2ULk3,本文对IUA_GenLk算法进行的优化是在数据集不变的情况下,将模式的支持度计数保存在Hash结构中。(3)IUAwithHash算法首先计算Ll和LNewl,然后通过IUAGenLk迭代生成Lk,并返回LluL2u⋯uLk。(4)FUPwithFP.Growth算法首先通过FP.Growth算法得到Line,然后基于性质2,通过LBase与LInc相交,并通过更新LBase与LInc中模式的支持度计数来产生新频繁模式集。(5)ARDM算法对IUA与FUP算法进行了整合与优化,分为维护L,维护Rules两部分。在维护L时,如果SptThr发生变化,则更新原数据集LBase,如果DSInc非空,即数据集增长,计算DSIIlc的LInc,并结合原数据集LBase更新新数据集L。在维护Rules时,如果只有CfdThr发生变化且CfdThr上升,则在原数据集Rules中筛选,否则由新数据集L重新计算Rules。3.3.3性能测试本文通过比较ARDM算法与FP.Growth算法在3个数据集上的运行时间以分析ARDM性能。ARDM算法和FP—Growth算法均通过C撑(.Net4.O)实现,运行环境为i5处理器,2G内存,Win7系统。在支持度阈值上升的情况下,因为ARDM只需在频繁模式集中筛选新的频繁模式,ARDM的运行时间显然要更快,这里只对支持度阈值下降和数据及规模增大情况下两种算法的运行时间进行比较。第一个数据集为事务型稀疏数据集Retail,每条记录包含1至50个事务ID不等,共88162条数据。FP-Grwoth,一,77一、~一~。,7。/、、吗~~‰、、Ⅵ图3一17FP.Growth算法在Retail上的运行时间43 北京化工大学博士学位论文图3.17、图3—18分别为FP.Growth算法与ARDM算法运行时间对比,数据集规模从17625至88126(步长17625),支持度阈值从O.1下降至0.05(步长0.01)。其中:x坐标为数据集规模(记录条数),Y坐标为支持度阈值,z坐标为运行时间,可以看到,ARDM的运行时间少于FP.Growth。图3.17是FP.Growth算法在Retail上的运行时间。图3.18ARDM算法在Retail上的运行时间第二个数据集为事务型稠密数据集Accidents,每条记录包含1至80个事务ID不等,共340183条数据。以下两图为FP.Growth与ARDM运行时间对比,数据集规模从68036至340183(步长68036),支持度阈值从O.95下降至O.9(步长O.01)。其中x坐标为数据集规模(记录条数),Y坐标为支持度阈值,Z坐标为运行时间,可以看到,ARDM的运行时间少于FP.Growth。FP矗rowth图3.19FP—Growth在Accidents上的运行时间 第二三章动态维护的关联规则算法研究图3.20ARDM在Accidents上的运行时间第三个数据集为属性型数据集,数据稠密度介于以上两个数据集之间,每条记录20个属性,每个属性6个取值,共5000条记录。以下两图为FP.Growth与ARDM运行时间对比,数据集规模从1000至5000(步长1000),支持度阈值从o.2下降至O.1(步长O.02)。其中x坐标为数据集规模(记录条数),Y坐标为支持度阈值,Z坐标为运行时间,可以看到,ARDM的运行时间少于FP—Growth。图3—21FP.Growth在属性型数据集上的运行时间,图3—21FP—Growth在属性型数据集上的运行时间。图3—21FP—Growth在属性型数据集上的运行时间45 北京化工人学博I:学位论文图3.22ARDM在属性型数据集上的运行时间ARDM算法充分利用了原频繁模式集信息,并且通过FP.Growth算法对FUP进行了优化,通过Hash结构对IUA进行了优化。在支持度阈值上升和置信度阈值变化的情况下,由于不需要再对数据集进行扫描,算法的效率很高。在当数据集规模变化不频繁,支持度阈值变化频繁时,由于Hash结构已经记录了模式的支持度计数,大大减少了数据集扫描次数,算法性能有很大提升。由于ARDM算法中的IUAwithHash和FUPwithFP—Growth在测试候选模式时需要对数据库进行多次扫描,所以当数据集较稀疏,支持度阈值较低时算法的优势较为明显。3.4小结●本章提出了关联规则的三种改进型挖掘算法,第一,基于Hash结构的关联规则交互挖掘算法HIUA,它是针对支持度阈值变化时的关联规则维护问题,,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。第二,基于部分支持度树的关联规则增量式更新算法IUPSMiner,该算法利用部分支持度树的结构提出了对关联规则的增量式更新算法,主要用于解决向数据库中添加新的数据而最小支持度不发生变化时的关联规则更新问题。该算法有效地利用己挖掘的关联规则和保留的部分支持度树来改善性能,并且只需对新增数据库部分进行一遍扫描,从而进一步提高算法的效率。第三,关联规则的动态维护算法ARDM,它主要应用于数据库和阈值同时发生变化的情况。现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题,该算法是基于IUA与FUP算法,提出数据库与支持度阈值同时变化情况下的关联规则维护算法,并通过Hash结构与模式增长方法进行优化。 第四章基于关联规则交互挖掘的企业财务风险分析未来是不可预测的,它具有不确定性,但是,不确定性当中又包含有规律性,就需要我们用科学的方法去发现规律,并解释我们发现的规律。企业发展过程中的不确定性既代表风险,又代表机会,企业风险管理主体在面对风险挑战时,要分析所能承受的不确定性,并且能够有效应对不确定性以及由此带来的风险和机会,增进创造价值的能力【92,931。国资委在2006年发布的《中央企业全面风险管理指引》认为:“风险就是不确定性,企业风险是指未来的不确定性对企业实现其经营目标的影响"[94】。来自不确定性的企业风险又是可以管理和控制的,通过对企业的风险分析、风险评估和风险控制活动,达到将企业发展中的不确定性转化为机遇,并通过数据挖掘技术寻找企业风险管理中的规则,为实现企业的发展战略、提升企业内在价值服务,为企业辅助决策支持服务p5|。4.1企业财务风险分析理论4.1.1企业风险管理理论美国内控研究委员会认为企业风险管理是一套由企业董事会与管理层共同设立、和与企业战略相结合的管理流程【961。它的功能是识别那些会影响企业运作的潜在事件和把相关的风险管理到一个企业可接受的水平,从而帮助企业达至它的目标。企业风险管理各个环节如下图4.1所示:要素冀羹图4-1企业风险管理——整合框架47嗣耘;维 北京化工大学博士学位论文2企业风险分析的流程企业风险的类别包括:法律与政策风险、财务风险和经营风险三个类别。企业风险分析的程序包括:1、分析风险因素、风险事故、捕捉风险征兆;2、确定风险的存在;3、确定风险的可能性和频率,确定有影响的要计量损失额;4、评判风险的性质和级别;5、评估风险:将本次风险与风险评价标准比较,排定风险次序;6、做好沟通与协调;7、对风险进行监督与审核。企业风险分析的程序可用流程图4.2表示:图4-2企业风险分析的流程图4.1.3企业财务风险管理的理论企业财务风险管理的理论是在企业风险管理理论的框架内,并且服务于企业风险管理。企业财务风险管理的环节包括:确定目标、财务风险识别、财务风险分析、财务风险评估与预警和控制财务风险等五个方面【971。确定目标是企业财务风险管理的首要任务,只有确立了目标,管理层才能针对目标风险并采取必要的行动来管理风险。在整个风险管理过程中,目标如同路标,为行为指明了前进的方向,目标代表了组织未来的发展愿望。财务目标是企业目标的细化,财务管理的具体目标包括货币资金管48 第四章基于关联规则交互挖掘的企业财务风险分析理的目标、成本费用管理的目标、信用政策的目标以及财务报告质量提高的目标等等f98】o财务风险识别是企业财务风险管理的基础,识别风险也是在企业确定了相关的财务目标之后,利用各种方法对影响企业财务目标实现的内、外冲毁事件进行分析和确认。财务风险识别的方法是通过各种渠道,采用各种手段及时获得足够、真实的财务信息,并对这些信息进行整理、归类、分析,从而作出定性的初步判断。财务风险分析是指在风险识别的基础上对财务风险的特征进行明确的定义描述。美国詹姆斯·林在《企业全面风险管理:从激励到控制》中指出:风险计量分析是风险管理过程中极有价值的一部分,没有适当的分析工具而试图管理风险,犹如没有仪器装备而试图驾驶飞机一样,在天气良好的时候,一切顺当,机构可能不会遭遇实质性的损失,但是,当天气变坏,机构就可能处于严重的危险之中而且无所适从【991。财务风险评估与预警是指在企业财务风险分析的基础上评估风险发生对企业所造成的影响程度,并建立风险预警机制【1删。财务风险评估应该从量化和非量化因素角度进行风险程度重要性水平进行界定,财务危机预警可以按指标性质分为危机、高度风险、低风险、正常、优良五个级值进行界定。图4—3是企业风险管理的五个环节。图4-3企业风险管理的五个环节4.2基于关联规则交互挖掘的企业财务风险分析方法企业财务风险分析的方法包括定性分析和定量分析两类,定性分析的方法主要是通过描述企业财务风险的特征、征兆及发展演变过程,并提出一些化解风险的建议。定量分析的方法主要是选取合适的风险分析模型和风险分析指标,对风险程度进行定量描述,并界定企业财务风险的等级。定量分析的方法与定性分析的方法相比更具有49 北京化工大学博士学位论文实际的意义,它能为管理层控制风险而采取措施提供理论和现实依据。定量分析方法的核心是建立风险分析指标体系和.风险分析模型‘tOl,102]。4.2.1企业财务风险分析指标体系以前学者在进行财务风险分析时曾经采用构建财务指标体系的方法,并且也取得了一定的研究成果【10扪。但是,财务指标的选择方法通常是根据个人对企业财务风险的认识和自己的经验判断,带有很强的主观性。本文选择财务指标的方法是通过数据挖掘的方法,比较所有财务指标,根据财务指标的相关性,最后决定选择哪些财务指标,具体相对的客观性。指标体系主要包括五个方面,具体内容如下:(一)企业盈利能力指标企业盈利能力反映企业获取利润的能力,企业只有长期盈利,才有抗击财务风险的能力,并迅速补偿因财务风险造成的各种损失,企业的盈利能力是所有财务指标中最重要的一个核心指标[104】。一般来说,企业的盈利能力通过以下几个方面的财务指标来反映和衡量。1.毛利率指标是指本期销售收入减去销售成本与本期销售收入的比率。2.营业利润率指标是指本期营业利润与本期销售收入的比率。3.净利润率指标是指本期净利润与本期销售收入的比率。以上三个指标都属于利润率财务指标,反映企业一定时期单位销售收入给企业带来的收益水平。利润率指标既可考核企业利润计划的完成情况,又可比较各企业之间和不同时期的经营管理水平,提高经济效益,利润率越高则反映企业的获利能力越强。4.每股收益指标是指本期净利润与总股份数之间的比率。5.净资产收益率指标是指本期净利润与净资产平均值之间的比率。6.总资产收益率指标是指本本期净利润与总资产平均值之间的比率。上述指标中,每股收益越高代表企业的盈利能力很强,同时也可以代表所有股东可以分得的红利就越高。净资产收益率是衡量企业盈利能力重要指标之一,它反映了股东权益的收益水平,净资产收益率可以直观的评价企业运用净资产带来的收益情况,它也是企业股利决策的重要基础。但是,净资产收益率高的企业并不代表它的盈利能力就一定很强,还要看企业的总资产收益率情况。总资产收益率是衡量企业全体股东和债权人共同投入资金的盈利能力的指标,总资产收益率越高代表企业运用资产的盈利能力就越强,但是,它是一个相对指标,评价单个企业总资产收益率的高低通常要与同行业其他企业的水平相比较才能得出结论。(二)企业营运能力指标营运能力是反映企业资产周转效率的指标,资产周转速度越快,反映企业生产和50 第四章基于关联规则交互挖掘的企业财务风险分析销售等经营环节的速度就快,经营效率就越高,形成收入和利润的周期就越短【1051。营运能力主要通过五个方面的财务指标来反映:1.应收帐款周转率指标是指本期赊销收入净额与本期应收帐款平均余额之间的比率。2.存货周转率指标是指本期销售成本与本期存货平均余额之间的比率。3.流动资产周转率指标是指本期销售收入净额与本期流动资产平均余额之间的比率。上述三个指标都是反映流动性资产周转率的财务指标,其中:应收帐款在企业流动资产中占有重要的角色,应收帐款周转率就是反映企业应收帐款周转速度的比率,一般来说,应收账款周转率越高越好,表明企业资产流动速度快,营运能力强。存货周转率是企业销售成本与平均存货余额的比率,反映存货的周转速度,即企业存货的流动性及存货资金占用量是否合理,一般来说,存货周转速度越快表明企业的流动性越强。流动资产周转率指企业主营业务收入净额同平均流动资产总额的比率,流动资产是企业全部资产中流动性最强的资产,流动资产周转率是评价企业资产利用率的重要指标,反映了企业流动资产的周转速度,一般来说,该指标越高,表明企业流动资产周转速度越快,效率越高。4.固定资产周转率=销售收入净额/固定资产平均净值=销售收入净额/(期初净值+期末净值)÷2。5.总资产周转率=销售收入净额/总资产平均值=销售收入净额/(资产总额年初数+资产总额年末数)÷2。上述两个指标都是反映固定性资产周转率的财务指标,其中:固定资产周转率也称固定资产利用率,是企业销售收入与固定资产净值的比率,固定资产周转率主要用于分析企业对厂房、设备等固定资产的利用效率,比率越高,说明利用率越高,管理水平越好。总资产周转率是指企业业务收入净额同总资产平均值的比率。总资产周转率反映了企业整体资产的营运能力,一般来说,资产的周转次数越多或周转天数越少,表明其周转速度越快,营运能力也就越强。每股净资产是指股东权益与总股数的比率,其计算公式为:每股净资产=股东权益÷总股数,通常每股净资产越高越好。(三)企业成长能力指标成长能力指标是反映企业在一定时期内的经营能力【106】。这些指标主要有以下几种。1.净资产增长率是指企业期末净资产总额减去期初净资产与期初净资产总额的比率。净资产增长率反映了企业净资产的增长情况,同时也反映了企业资本规模的扩张速度,是衡量企业总量规模变动和成长状况的重要要财务指标。2.总资产增长率=本年总资产增长额/期初资产总额=(期末总资产一期初总资 北京化工大学博士学位论文产)/期初总资产。总资产增长率反映企业总资产增长情况。总资产的增长来源于两个方面:一是所有者权益的增加,二是公司负债规模的扩大,总资产的增长率越高,表明企业一定时期内资产经营规模扩张的速度越快。3.主营业务收入增长率是指本期主营业务收入减去上期主营业务收入与上期主营业务收入的比率。4.净利润增长率是指本年净利润减去上年净利润与上期净利润的比率。净利润反映当年可供出资人分配的净收益,也称为税后利润。净利润多,企业的经营效益就好,净利润少,企业的经营效益就差,它是衡量一个企业经营效益的重要指标。5.每股收益增长率=(本期每股收益一上期每股收益)/(上期每股收益)=(本期净利润/本期总股本一上年同期净利润/上年同期总股本)/(上年同期净利润/上年同期总股本)。每股收益增长率反映企业业绩增长情况,每股收益增长率来源于资本性开支、资产周转率、营业利润率的增长,同时净负债比率和股息分配率必需下降才行。需要注意的是,每股收益增长率在企业扭亏为盈和由盈转亏的情况下,或是原来的每股收益极低的时候会失去指导意义。(四)企业偿债能力指标企业偿债能力指短期和长期两个方面的偿债能力,企业短期偿债能力不足,不仅会影响企业的社会信誉,增加以后筹集资金的难度与成本,还可能使企业陷入生产经营的危机,一般来说,企业的流动比率为2,速动比率为1比较安全叫71。1.流动比率指标是指全部流动资产与全部流动负债之间的比率。2.速动比率指标是指全部流动资产减去存货与流动负债之间的比率。3.现金比率指标是指所有现金加上有价证券与流动负债之间的比率。流动比率高反映企业短期偿还债务的能力强,但是流动比率过高,可能是积压大量存货和应收账款或拥有过多的现金。速动比率反映企业使用速动资产偿还短期内到期债务的能力,速动资产企业短期内可变现的全部资产。通常速动比率高则流动性强,速动比率低则流动性越差。现金比率反映企业使用现金及现金等价物偿还到期债务的能力,通常现金比率高则流动性强,但是企业的获利能力可能会受到影响;现金比率低则流动性越差,偿债短期债务的能力就弱【108】。长期偿债能力是指企业偿还长期债务(本金+利息)的能力,通常企业的长期偿债能力用负债比率和利息收入倍数两项指标来衡量。4.利息支付倍数反映企业本期营业利润与利息费用的比率,如果比率值越大则企业偿债能力越强。5.股东权益比率反映所有者权益总额对资产总额的比率,比率越高则偿还长期52 第四章基于关联规则交互挖掘的企业财务风险分析债务的能力越强,反之则偿还长期债务的能力越弱。5.资产负债率又叫财务杠杆,该比率越高则偿还债务的能力越弱,比率越低则偿还债务的能力较强,债权人发放贷款安全程度较高,同时也反映出企业没有很好地利用其资金【1091。(五)企业现金流量指标企业现金流量指标在企业的管理与决策中起着重要的作用,现金流是一个动态流动的过程,应该使用动态监测的方法去研究和分析企业的现金流量指标nm】。1.经营现金净流量对流动负债的比率反映本期经营活动所产生的现金净流量能否支付所有流动负债,通常比率越高则偿还流动负债的能力越好。2.经营现金净流量对负债的比率反映本期经营活动所产生的现金净流量足以抵付总负债的比率。一般来说,比率越高,说明资产的流动性越强,偿还债务总额的能力越强。3.经营现金净流量对净利润的比率反映企业净利润与经营活动产生净现金流量差异的变化,以便反映企业经营的真实的获利能力。4.经营现金净流量对销售收入的比率反映企业经营活动产生净现金流量与销售收入之问的比率。除了上述五个方面的财务指标外,还有一些财务指标如:营业收入、每股净资产、每股现金流量等,它们并不属于哪一类指标,但是它们在企业进行风险分析时起着非常重要的作用,本文研究过程中也将它们选入风险分析指标体系。4.2.2财务指标的相关性分析根据财务分析理论的研究成果:运用传统的分析变量相关系数度量的方法,选取一些样本公司的财务指标进行相关性分析,剔除其中的一些高度相关的财务指标。相关性相关系数可以用如下公式表示:rx护—堡髦墅二一(4-1)“。√胛∑x;一(∑Xi)2√咒∑y;一(Xy,)2其中:X和Y表示两个变量,rx,y表示两个变量的相关系数,且一1≤rx,y≤1。当lrx.vl=1时表示X和y完全线性相关。其中:rx,y=1时表示x和Y完全正相关,rx,y=一1时表示X和Y完全负相关。rx.v=O时表示x和y1不相关,在绝大多数情况下,一1
此文档下载收益归作者所有