资源描述:
《基于视觉的足球机器人决策规划研究进展》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于视觉的足球机器人决策规划研究进展第2(】卷第2期2006年4月.济南大学(自然科学版)JOURNALOFJINANUNIVERSITY(Sci.&Tech.)V01.20No.2Apr.2006文章编号:1671—3559(2006)02—0155—04基于视觉的足球机器人决策规划研究进展厉广伟,曹爱增,尹建芹(济南大学信息科学与工程学院,山东济南250022)摘要:机器人足球比赛的核心系统是决策规划.对整个机器人足球决策子系统分层加以论述,主要介绍了国内外关于机器人足球决策的一些主要研究成果和最新进展.既介绍了传
2、统的基于规则的方法,也讨论了基于模糊逻辑,遗传算法,强化学习等智能方法的决策技术.并就关键问题进行了分析和探讨,同时对机器人足球的发展趋势做了展望.关键词:机器人足球;决策规划;多智能体;路径规划中图分类号:TP242文献标识码:A型机器人足球系统为研究背景.基于视觉的机器人足球系统一般分为4个子系统:视觉子系统,决策子系统,无线通讯子系统和机器人小车子系统.决策子系统是整个系统的决定部分.系统通过视觉系统获取现场信息,决策系统从策略库中调用相应的比赛策略给各个机器人分配角色并进行相应的行为规划,最后形成控制命令字通过无线通讯
3、系统发送给足球机器人,完成作战任务.1机器人足球简介2机器人足球决策方法机器人足球是伴随着智能机器人技术和分布式人工智能的发展而迅速兴起的一种高科技对抗活动,是机器人和人工智能领域最具挑战性的研究课题.机器人足球,是1992年加拿大哥伦比亚大学教授AlanMackworth在一次国际人工智能会议上在其论文《0nSeeingRobots))中首次提出的l_1j.目前国际上有组织的机器人足球比赛有两大系列——FIRA(FederationofIntemationalRobot—SoccerAssociation)和Robocup(
4、RobotW0rldCup).举办机器人世界杯足球赛的意义不单单在于比赛本身,而是通过提供这样一个标准任务,使得研究人员利用各种技术,获得更好的解决方案,从而有效地促进各个相关领域的发展.涉及的研究领域包括机器人学,视觉与传感器技术,专家系统,多智能体系统,实时模式识别与行为系统,神经网络,优化算法,实时规划和推理等.实体型足球机器人系统主要分为集控式足球机器人系统和自主式足球机器人系统.由于FIRA系列大部分比赛和Robocup的小型机器人比赛大都采用全局视觉作为感知系统(模仿人类的眼睛),采用轮式移动机构(模仿人类的腿),
5、属于集控式足球机器人系统.在这里主要以基于视觉的集控式轮式微收稿日期:2005—08—20基金项目:济南大学科技基金(Y0401)作者简介:厉广伟(1980一),男,山东济南人,助教,硕士生.决策子系统是足球机器人系统的核心子系统,也是多智能体协作理论研究在足球机器人系统中的集中体现.对于基于视觉的微型机器人足球系统,根据它的硬件构成,采用集中式决策结构.全队统一决策,各个机器人仅作为决策控制的执行机构.目前对于集中式决策子系统的开发常使用分层递阶控制的方法,对决策思路进行逻辑上的分层.一般来说,先确定机器人之间的协作关系,然
6、后根据需要决定每个机器人的运动方式,再转化成具体的行为.分层的具体方式可以有一定的不同,一般将其分为协调层,运动规划层,基本动作层.下面就对机器人足球决策系统逐层展开讨论.2.1协调层协调层主要是解决多机器人的协作问题,属于高层决策.它根据视觉系统数据,获得各机器人和小球信息,判断场上形势,从策略库中选择合适的协作模式,并将合作的意图转入下一层.关键有两点:场上形势的判断和协作模式的选取.具体表现为机器人队形的确定和转换以及角色的分配和适时转换.根据对手的强弱和比赛的性质,一般常见的比赛策略有如下几种:宽度区域防守,深度区域防
7、守,全攻全守,自由人战术,人盯人战术,孤注一掷战术和保守防守战术等.不管选择哪种策略,都要考虑济南大学(自然科学版)第2o卷机器人的队形和角色分配问题.足球机器人通过队形进行整体协调,体现攻防转换.和人比赛一样,队形的确定主要是根据场上对手强弱,比分多少,比赛所剩时间,球的位置以及比赛经验而相应采取进攻队形,防守队形和攻防兼顾等各种队形并自动转换.队形是由角色构成的,可用一维数组来表示.队形确定以后,任务分解为角色集合.每个机器人在某一队形中充当一定的角色.如何进行角色的合理分配和转换,是多机器人有效协作的关键.文[2]提出了
8、FIS—Q(FuzzyInferenceSystemforQ—learning)机器人角色分配机理,利用模糊推理产生状态空间的输人,Q—learning为角色分配,效果较好,但随着比赛队员增加,状态空间指数增长,因而Q—learning训练速度较慢,实时性下降.广东工业大学钟