基于强化学习算法的电梯调度系统的研究

基于强化学习算法的电梯调度系统的研究

ID:33662919

大小:2.44 MB

页数:79页

时间:2019-02-28

基于强化学习算法的电梯调度系统的研究_第1页
基于强化学习算法的电梯调度系统的研究_第2页
基于强化学习算法的电梯调度系统的研究_第3页
基于强化学习算法的电梯调度系统的研究_第4页
基于强化学习算法的电梯调度系统的研究_第5页
资源描述:

《基于强化学习算法的电梯调度系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、东北大学硕士学位论文摘要基于强化学习算法的电梯调度系统的研究摘要随着高层建筑的不断增多和智能建筑的快速发展,人们对建筑物内的客流运输设备电梯提出了越来越高的要求。为了提高电梯的运输能力和服务质量,实现多台电梯的有效控制——电梯调度,正越来越成为人们研究的热点问题。本文主要研究了电梯群组调度问题。电梯交通流随时间变化呈现出规律各异的多种交通模式,所以本文在处理交通流分析问题的过程中,将聚类思想引入电梯交通流分析,并提出了一种新型的人工免疫聚类算法。对电梯交通流进行交通模式的聚类分析和模式识别,突破了传统的四种交通流模式:空闲、随机层问

2、、上高峰和下高峰模式的局限,将交通流细分为7种模式,便于提高后续进行电梯动态调度研究的准确度,同时计算出各模式对应的浓度和聚类中心,方便对交通流的在线模式识别。在解决电梯群组调度这种大规模动态优化问题时,本文采用强化学习方法作为在与环境的交互过程中学习最优策略的方法。以马尔可夫决策过程(MDP)为背景,模型化电梯群组调度问题,综合考虑平均等待时间、平均乘梯时间和电梯停靠次数这三个因素,计算出的综合成本作为性能评价的综合指标。采用随机行为选择策略和前馈神经网络分别解决强化学习在应用中所存在的探索问题和值函数的泛化问题。并将两者与Q—l

3、earning的值迭代算法结合,共同构成基于强化学习的电梯群组调度算法。最后,构建了基于泊松分布的大楼客流交通模型,并设计了基于强化学习的电梯群组调度系统,利用MATLAB仿真,结果证明,在对交通流进行反复训练时,Q值曲线间的误差是逐渐减小的,说明了本文使用的强化学习方法对Q值函数的逐渐逼近作用。在5种不同的交通流条件下,基于强化学习的动态调度方法与其它方法比较呈现出一定的优越性,尤其在上高峰模式和随机层间模式下有更好的适用性,充分说明了基于强化学习的电梯群组动态调度算法的有效性和可行性。关键词:电梯交通流;人工免疫聚类分析;电梯群

4、组调度;马尔可夫决策过程;强化学习一Ⅱ一东北大学硕士学位论文ResearchofElevatorGroupSchedulingSystembasedonReinforcementLearningAlgorithmAbstractWiththecontinuousincreasingofhighbuildingsandtherapiddevelopmentofintelligentbuildings,moreandmoredemandshavebeenbroughtforwardtotheelevatorsthattransportt

5、heguestsinthebuildings.Inordertoimprovethetransportationefficiencyandtheservicequality,andnowadayspeoplepaymoreandmoreattentiononhowtocontroltheelevatorsvalidly-elevatorgroupcontrolSOithasbecomeahotissueinresearchrecently.Thisthesisismainlyabouttheresearchinelevatorgro

6、upschedulingproblem.Withtheclusteringanalysisonelevatortrafficflow,Elevatorgroupschedulingsystembasedonreinforcementlearningalgorithmisproposed.Duringtheprocessoftheanalysisonelevator锄cflow,basedondiversityofelevatortrafficwithtime.Clusteringideaisintroducedtosolveanal

7、ysisofelevator删cflowandArtificialImluuneClusteringA190rithra(AICA)isproposedtorecognizeandclusterelevator僦cflow.Theelevatortraf葑cisdividedintoseventrafficpatternparticularly,whichimprovestheaccuracyofschedulingandalsoavoidsthelimitsoffourtraditionaltra伍cpatterns:off-pe

8、ak,inter-floor,up-peakanddown-peakpatterns.Theproportionandcenterofeachtramcpatternarecalculatedtorecognizeeachtlat五c

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。