欢迎来到天天文库
浏览记录
ID:46421259
大小:79.00 KB
页数:10页
时间:2019-11-23
《基于决策树改进AdaBoost算法在车辆检测中应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于决策树改进AdaBoost算法在车辆检测中应用摘要摘要:为满足车辆检测实时性和准确性需求,将基于C4.5的决策树算法作为AdaBoost算法的弱分类器,产生一种速度快、识别率高的强分类器,称之为AdaBoostDT算法。算法训练多个决策树并将之作为弱分类器,之后通过改进级联架构的AdaBoost算法将若干弱分类器组合成一个强分类器。该算法特点在于:相对于广泛使用的以SVM作为弱分类器的算法,其以决策树作为分类器,速度提高了29%;通过在AdaBoost算法进行强分类器的形成阶段加入再判决函数,准确率提高了14
2、.1%关键词关键词:AdaBoost算法;决策树;车辆检测D0ID0I:10.11907/rjdk.162868中图分类号:TP319文献标识码:A文章编号文章编号:16727800(2017)0050129030引言随着我国城镇化建设的飞快发展及汽车保有量的增加,土地资源越发紧张,停车难的问题越发严重,由此产生的交通拥堵事故层出不穷。停车引导自动化成为一项重要技术,其解决的主要问题是车辆识别的速度和准确率。目前存在的识别方案主要有以下几种:红外感应、无线传感器、图像识别。在这些方案中,第一种还需要解决信号干扰、
3、信号复用等问题,第二种方法不仅建设的成本高,而且还需要解决信道可靠传输的问题,结构比较复杂。由此,基于图像识别的车辆检测与停车位识别技术受到人们的广泛关注[1],这其中最受关注的当属分类器技术分类器技术不仅能够用于目标检测领域,在其它很多领域也发挥了重要作用,例如在语音信号处理、数据挖掘、信号聚类、图像检索等。目前存在很多能实现分类功能的算法,其中应用比较广泛的为AdaBoost算法[2],该算法先对车辆进行特征提取,在此基础上采用支持向量机(SupportVectorMachhine,SVM)[3]的方法进行车
4、辆识别,取得了一定效果。基于SVM的检测方法虽然具有很强的分类能力,但是选取特征的过程复杂,且易陷入局部极小。此外,基于SVM的检测方法一般都需要比较大的计算量进行特征提取,这在一定程度上影响了算法的性能,很多情况下不能满足车辆识别的效率要求本文提出的AdaBoostDT算法通过采用决策树[45]作为AdaBoost的弱分类器,提高了车辆识别速度,并通过改进AdaBoost算法的级联架构,弥补决策树作为分类器所导致的准确率下降,从而使集成后的强分类器与基于SVM的分类器相比,在准确度略微下降的情况下,速度能有很大
5、程度的提升,更好地满足车辆检测系统对于实时性的要求1基本原理1.lAdaBoost算法AdaBoost算法是一种机器学习算法,它能将弱分类器提升为强分类器,其中分类器的强弱是指识别率高低。算法是通过调整训练集上样本的权重来实现其功能。开始时每个样本的权重相等且总和为1,随后AdaBoost算法对训练集进行训练,产生第一个弱分类器,并计算错误率。根据错误率调整权重,提升错判样本的权重,降低辨别正确的样本的权重,这样在之后的训练中就会更多地考虑这些被错判的样本。在调整后的样本权重基础上,再进行训练产生新的分类器,次迭
6、代后就产生了N个检测能力一般的弱分类器。AdaBoost再将这些弱分类器按照一定的权重进行一系列的组合,产生强分类器。理论证明,弱分类器的数量越多,各个弱分类器之间的差异越大,强分类器的效果越好1.2决策树决策树算法是一种由JRossQuinlan等提出的逼近离散函数值的算法,于20世纪60年代出现。该算法最初的用处是在已知各种情形出现概率的情况下,通过决策分支来获取期望值及其对应的概率,评价项目风险,判断可行性。由于形状像一颗拥有很多分枝的树,所以称为决策树决策树算法是典型的分类算法,该算法先处理数据,产生一定
7、的规则和决策树,然后再运用决策分支对数据进行分析,本质是按照一定的规则对数据进行分类。典型的决策树算法有ID3⑹、C4.5[7]、CART等。本文提出的AdaBoostDT算法采用基于C4.5算法的决策树作为弱分类器。C4.5算法作为ID3算法的改进算法,弥补了ID3算法的两个不足之处[8]:一是ID3算法采用信息炳作为选择样本属性的标准,很多时候,通过该标准选择的属性并不具有代表性,C4.5算法采用信息增益率作为样本属性的选择标准,弥补了这个缺点;二是ID3算法只对属性离散的数据集有处理能力,而不能处理属性连续
8、的数据集,而C4.5算法则对属性离散和属性连续的数据集都有较好的处理能力2AdaBoostDT算法1.1弱分类器最佳分割阙值方法改进C4.5算法作为ID3算法的改进算法,弥补了ID3算法的两个缺点,但仍存在一些不足:C4.5算法要随机地在属性的不同取值中插入一些点,计算这些点的信息增益率,选择值最大的属性作为最佳分裂属性。当遇到决策树节点数量较多的情况时,将影响到决策树的
此文档下载收益归作者所有