欢迎来到天天文库
浏览记录
ID:32469803
大小:5.72 MB
页数:119页
时间:2019-02-06
《带置信度分类器的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要高风险领域的分类问题对模式分类算法提出以下三个挑战:1)能否设计一种分类器模型,使得它的输出结果能够附带置信度;2)预测输出的置信度是有效的,应该使得算法的准确率能够被置信度所控制。3)算法应能够独立地对每个测试数据提供相应的置信度评估,也就是说,能够根据指定的置信度产生相应的预测结果。针对上述三个挑战,我们引入了基于转导推理和随机性检验的置信预测方法来解决这些问题。近年新发展起来的一致性预测器(CP)是这种方法的典型代表。但是,CP在实践中的实用性较差,主要是其固有的运算效率低下、以及对样本奇异函数的设计缺乏指导性准则。我们的工
2、作主要是改进了CP的理论模型,提出了混合压缩一致性预测器(HCCP)的算法框架及其实现技术,使其更适合于实际应用。HCCP在预测性能与计算效率间取得了一个较好的折衷,它在处理大数据集学习问题时,在保持算法的预测效率的同时大大提高了CP的运算效率。HCCP的运作特点是将用于学习的样本序列划分成两个部分,并采用两阶段混合压缩:第一阶段先将前一部分序列样本压缩成一个模型,并以知识的形式保存;第二阶段再将上述知识传递给后续的检验样本序列用于置信预测。在算法实现技术方面,HCCP采用有监督的度量学习方法来实现有效信息在两个子序列(训练样本序列和
3、检验样本序列)中的传递。并分别通过有监督核学习方法(HCCP.KerNN)和随机森林技术(HCCP.RF)实现了度量学习和样本奇异函数的设计。我们还从实验角度展现了HCCP—RF算法在田纳西一伊斯曼化工过程(TEP)这样的流程工业大系统的在线故障置信检测中的适用性和有效性。针对小数据集的学习问题,我们也提出了一种无划分的HCCP.RF算法,它取消了对学习样本集的划分,更加适用于处理小样本数据。通过对慢性胃炎中医诊断数据集的实验,验证了该算法的有效性。最后,对本文的工作进行了总结,并对今后的研究工作提出了展望。关键词:分类问题;置信预测
4、;一致性预测器AbstractTherearethreechallengestotheresearchersOiltheclassificationinthehigh—riskareaS:Canwedevelopaclassificationalgorithmthatoutputspredictionscoupledwithconfidencelevel?2)Aretheseconfidencesforthepredictionsreallyvalid,i.e.,couldtheaccuracyratebeguaranteedbyth
5、econfidencelevel?3)Couldthealgorithmgiveapredictionwithaconfidenceleveltailoredforeachindividualinstance,inotherwords,coulditprovideapredictioncorrespondingtotheconfidencelevelpredefined?Facedtothesechallenges,wehaveintroducedamethodwhichusesthetransductiveinferenceandt
6、herandomnesstestofi.i.d.sequencestodevelopoursolution.TherecentlyemergedConformalPredictor(CP)isanalternativesolutionwhichcanoutputpredictionwithvalidconfidence.However,therearestillcertaindisadvantagesintheframeworkofCP,suchastheinherentcomputationalcostlinessandthelac
7、kofguidanceforthedesignoftheexamplenonconformitymeasure.WehavefocusedontheimprovementandtheenhancementofCP,andhavethenproposedanewHybrid—CompressionConforrnalPredictor(HCCP)whichperformsHCCPaimstoobtainagoodbalancebetweenthepredictiveperformanceandthecomputationaleffici
8、ency.ItCanmaintainarelativelyhi曲predictiveperformancewhileimprovinggreatlythecomputationalefficiencyindealingw
此文档下载收益归作者所有