欢迎来到天天文库
浏览记录
ID:28109087
大小:1.06 MB
页数:11页
时间:2018-12-08
《游戏AI的前世今生,完美的目标不完美的世界.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、游戏AI的前世今生,完美的目标不完美的世界 近两年,世界上最前沿的AI系统已经开始抛弃人类经验,依靠自学从零开始逐渐成长,其中最典型的是DeepMind的AlphaZero,它能在短短8小时内就从一无所知的“婴儿”成长为精通围棋、将棋和国际象棋的顶级大师。 但研究人员还在努力,他们希望能把这个成果扩展到游戏以外的领域。 游戏AI的前世今生 在DeepMind的围棋AI出现以前,如果机器想打败人类,它们至少还得尊重人类积累下的经验。 1997年,为了击败当时的国际象棋冠军Garry游戏AI的前世今生,完美的目标不完美的世界 近两年,世界上最前沿的AI系统已经开始
2、抛弃人类经验,依靠自学从零开始逐渐成长,其中最典型的是DeepMind的AlphaZero,它能在短短8小时内就从一无所知的“婴儿”成长为精通围棋、将棋和国际象棋的顶级大师。 但研究人员还在努力,他们希望能把这个成果扩展到游戏以外的领域。 游戏AI的前世今生 在DeepMind的围棋AI出现以前,如果机器想打败人类,它们至少还得尊重人类积累下的经验。 1997年,为了击败当时的国际象棋冠军GarryKasparov,IBM的工程师们准备了几个世纪的国际象棋资料,这也是超级计算机“深蓝”能获胜的主要原因。 但现在,这种穷举法已经过时了。研究人员正在重新思考用机器整合人类知
3、识的方式,而目前的主流趋势是:不要插手。 是的,人类选择尊重AI的学习自主性。去年10月,DeepMind团队发布了一个新的棋类AI:AlphaGoZero。它无需任何人类资料数据,只要给出游戏规则,它就能自我博弈,不断进步。AlphaGoZero的第一次尝试是完全随机的,在每场比赛结束后,它都会对所取得胜利和未取胜的新知识进行总结。经过训练,最后这个AI和曾击败过李世石的AlphaGo直接对决,以100比0拿下了彻底的胜利。 紧接着,在去年12月,精通三种棋类游戏的AlphaZero在比赛中击败AlphaGoZero,把刚登上最佳围棋AI宝座的后者赶了下去。之后,DeepM
4、ind宣布棋类项目正式终止,但这系列AI给社会带来的巨大震动却迟迟无法平息。在AI咄咄逼人、别创一格的棋风中,人类第一次对机械“智慧”感到惊奇。 2016年,李世石与AlphaGo的对决 除了围棋,自学AI在德州扑克、Dota2上也开始崭露头角。以Dota2为例,去年,OpenAI的强化学习bot在中路solo中击败职业选手Dendi,赢得众人瞩目。而今年,他们又推出5人团队OpenAIFive,这些AI已经可以在比赛中击败业余玩家,并且据称天梯分在6000以上。虽然在Ti8上连输两局,提前“淘汰”,它们的进步之大还是有目共睹的。 但游戏并不是这些实验室,以及实验室背后
5、的投资机构的唯一目标,他们有更大的野心。DeepMind希望把类似方法用于构建室温超导体、把蛋白质折叠成药物分子等现实问题。OpenAI也曾直言开发这类技术是出于现实场景需要,至于瓜分奖金池里的2500万美金,这在宏图大志面前只是个微不足道的“小目标”。 当然,他们中也有一帮人只是想单纯实现“人工智能”,让机器人能像人一样思考,并对不同类型的问题作出多种选择——这个定义不明的目标确实令人着迷。 机器学习领域是近年来的吸金热门,尽管无数人在这些AI系统中进行了投资,但我们目前还不清楚这种技术能走多远。按照华盛顿大学计算机科学家佩德罗·多明戈斯的说法:“我不确定这种想法是否能被推
6、广,游戏和现实是两个世界。” 完美的目标,不完美的世界 许多游戏,比如国际象棋和围棋,它们的一个共同特点是玩家随时可以观察棋盘上双方棋子的位置,也就是玩家是站在全知视角的,他们掌握着游戏状态的“完美信息”。在这种情况下,无论棋局多复杂,他们要做的就是结合看到的场景进行思考。 但现实并非如此,大多数现实世界的战略互动都会涉及隐藏信息,比如用机器诊断疾病或进行商务谈判。 Dota2的视野是受限的。在游戏中,地图本身是黑的,只能靠英雄、建筑和侦查守卫提供一定视野,这就意味着AI要根据不完整的数据信息进行推断,同时预测双方英雄的发育进度。在这两场比赛中,可以发现AI的发挥很大程度
7、上需要依赖视野,当敌方走进树林阴影后,它们不会预判对方走位,大多数时候都选择放弃追杀。 而这种不完全信息在星际2里就更突出了。这是一款非常考验操作和战略意识的游戏,玩家需要培养自己的部队进行作战,目标是拆光敌方大本营。但是,整片战场从头到尾会一直笼罩在阴影中,玩家只能依靠己方建筑和部队获得一定视野。加上地图很大,即便只是派小兵去侦查,侦查结果也会充满不确定性。 从DeepMind放出下一个目标是星际2的豪言后,他们就再没有公布任何突破性进展。过大的动作空间、过快的推进节奏,每
此文档下载收益归作者所有