欢迎来到天天文库
浏览记录
ID:20654465
大小:78.50 KB
页数:10页
时间:2018-10-14
《基于车辆诱导的交通灯动态配时算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于车辆诱导的交通灯动态配时算法研究文I喹赵佳文赵云志沈阳理工大学信息科学与工程学院摘要:随着城市交通流量口益增加,现有的交通灯固定时间控制系统不能很好解决交通拥堵问题。针对这一背景,采用基于eu习的交通灯控制策略(QTGCS)对交通灯进行动态配时,以减少车辆在交叉口的平均等待时间,通过模糊逻辑控制根据车辆诱导信息对习的动作选择进行优化(FQTGCS),以提高习算法的收敛速度。实验结果表明,所采用的交通灯控制策略可以很好地解决交通拥堵问题,能更好地提高交通系统的性能。关键词:交通灯控制;Q学习;模糊逻辑控制;作者简介:文峰(1977—),
2、男,副教授,博士,研究方向:人工智能。收稿日期:2016-10-24基金:国家自然科学耦金资助项A(61672359)ResearchofTrafficLightsDynamicTimingAlgorithmBasedonVehiclesInductionWENFengZHAOJiawenZHAOYunzhiShenyangLigongUniversity;Abstract:Withthetrafficflowincreasinginourcountry,thefixedtimetrafficlightscontrolsystemcan’
3、tverywellsolvetheproblemoftrafficcongestion.Underthisbackground,thetrafficlightcontrolstrategybasedonQ-]earningalgorithm(QTGCS)fordynamictrafficlighttimingisputforward,inordertoreducetheaveragewaitingtimeofvehiclesinintersection,andbythefuzzylogiccontrolalgorithmandusingv
4、ehiclesinducedinformationtooptimizetheactionsectionoftheQ-learning(FQTGCS),theconvergencespeedoftheQ-learningalgorithmisimproved.Theexperimentalresultsshowthattheproposedtrafficlightscontrolstrategycansolvetheproblemoftrafficcongestion,andbetterimprovetheperformanceoftran
5、sportationsystem.Keyword:trafficlightscontrol;Q-learning;fuzzylogiccontrol;Received:2016-10-24随着我国城市现代化进程的不断推进,交通问题成为影响我国社会发展的一个大问题,而城市道路交通问题的核心就是交通灯控制系统和车辆诱导系统。常见的车辆诱导系统基于最短路径策略,常见的交通灯控制系统基于岡定时间配置策略(FTGCS),这种配时策略存在交叉口车辆较少的相位为绿灯和车辆较多的相位为红灯的问题。越来越多的学者致力于智能交通系统的研宄,提出很多交通灯控制
6、策略。文献[1-2]通过模糊逻辑控制对交叉口车道队列长度进行模糊得到配时方案对交通灯进行控制。文献[3-4]通过强化学习算法利用Agent与环境交互为交通灯选择最优动作。文献[5-8]通过0_学习算法与环境交互,并且利用模糊逻辑控制对当前交叉口的队列长度进行模糊化或者对0_学>』的冋报函数进行模糊化,来选择交通灯的最优动作,模糊逻辑控制主要应用在0_学习状态空间的划分。在实际的交通控制策略中,交通灯控制策略和车辆诱异策略在信息产生、数据处理和策略实施等多个方面应和互协同。本文提出一种由环境状态到动作映射的Q_学习方法,应用到交通灯动态配时
7、中,并且通过模糊逻辑控制根据车辆诱导信息得到当前交通灯与协同交通灯的数据对Q_学习的动作选择进行优化,可以提高Q学习算法的收敛速度,达到提升智能交通系统性能的效果。1模型及问题分析1.1交通灯相位模型交通灯相位是指一个交叉口某个或某些方向的交通流同时得到通行权的时间带。本文相位方案有:三相位方案,如图1所示;四相位方案,如图2所示。每个相位包含左转、右转、直行、调头。图1三岔U相位下载原图图2四岔口相位下载原图1.2多智能体多智能体系统(MAS,Multi-Agent-System)是多个智能体组成的集合,它的目标是将大而复杂的系统转变成
8、小的、彼此互相通信和协调的、易于管理的系统。1.3强化学习强化学习过程中Agent判断当前状态,选择一个动作作用于环境,环境在动作的影响下发生变化,并反馈给Agent—个奖惩值,Agent根据
此文档下载收益归作者所有