alphago小白的人工智能之路

alphago小白的人工智能之路

ID:21750541

大小:12.50 MB

页数:40页

时间:2018-10-20

alphago小白的人工智能之路_第1页
alphago小白的人工智能之路_第2页
alphago小白的人工智能之路_第3页
alphago小白的人工智能之路_第4页
alphago小白的人工智能之路_第5页
资源描述:

《alphago小白的人工智能之路》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、小白的人工智能之路2018-6AlphaGo&AlphaGoZero在接下来的一个小时中,你将会……认识“谁”是可爱的AlphaGo还有它的兄弟AlphaGoZero……探知AlphaGo和AlphaGoZero的实现原理深度神经网络……蒙特卡洛树搜索……有监督学习做自己的井字棋AI/人机对弈程序易于实现的极大极小树算法AlphaGoHumanorAI?AlphaGo战绩2016年1月27日AlphaGo以5:0完胜欧洲围棋冠军樊麾2016年3月9日到15日挑战世界围棋冠军李世石的AlphaGo以4:1取得胜利2017年5月23日到27日乌镇围棋峰会,AlphaGo以3:0战胜世界围棋冠军

2、柯洁AlphaGo家族AlphaGo→AlphaGoZero→AlphaZeroAlphaGo:于2014年开始由GoogleDeepMind开发的人工智能围棋软件。它以人类围棋高手的棋谱作为参考数据。AlphaGoZero:AlphaGo的团队于2017年10月19日在《自然》杂志上发表了一篇文章,介绍了AlphaGoZero,这是一个没有用到人类数据的版本(围棋棋盘大小与规则除外),比以前任何击败人类的版本都要强大。通过跟自己对战,AlphaGoZero经过3天的学习,以100:0的成绩超越了AlphaGoLee的实力,21天后达到了AlphaGoMaster的水平,并在40天内超过了

3、所有之前的版本。AlphaZero:AlphaZero使用与AlphaGoZero类似但更一般性的算法,在不做太多改变的前提下,并将算法从围棋延伸到将棋与国际象棋上。AlphaGo家族有多可怕?!训练第0天的AlphaGoZero什么都不懂,训练第3天打败AlphaGoLee,训练第21天打败AlphaGoMaster,训练第40天超越了此前AlphaGo系列的所有成员。AlphaGo家族有多可怕?!AlphaZero在短时间训练后能达到其他算法的同等或更高水平版本使用规则硬件Elo等级分的理论峰值战绩AlphaGo樊(v13)中国规则176个GPU,分布式3,1445比0战胜[???]A

4、lphaGo李(v18)48个TPU,分布式3,7394比1战胜[???]AlphaGoMaster4个TPUv2,单机4,858网棋60比0战胜职业棋手;3比0战胜柯洁;1比0战胜人类团队AlphaGoZero川普-泰勒规则4个TPUv2,单机5185100:0战胜AlphaGo李;与AlphaGoMaster对战胜率达90%AlphaZero4个TPUv2,单机N/A60:40战胜AlphaGoZero(3天版本)AlphaGo走下神坛AlphaGo的胜利意味着AI技术有了突破性的进展?AlphaGo的胜利意味着机器打败人脑?答案是否定的。其实,AlphaGo在算法层面上并没有太多新意

5、,而是通过Google强大的团队和计算平台,把已有的技术整合在一起,利用大量的训练数据和计算资源来提高准确性。AlphaGo=蒙特卡洛树搜索算法(MCTS)+深度神经网络博弈树把游戏看作一棵树每个结点是一种游戏状态。名称棋盘大小(位置数)状态空间复杂度(状态数)状态树复杂度(叶子结点数)平均游戏长度井字棋(Tic-Tac-Toe)91031059四子棋(Connect4)421013102121翻转棋(Reversi/Othello)641028105858跳棋(Internationaldraughts/Checkers)501030105490中国象棋9010401015095国际象棋

6、(Chess)6410471012370五子棋(Gomoku)22510105107030围棋(Go)3611017010360150六子棋(Connect6)361101721014030常见对弈游戏的状态复杂度对比围棋的状态复杂度为10170那么10的170次方意味着什么呢?21个百亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿亿这个规模十分可怕!由于不能将所有状态都遍历一次,于是AlphaGo使用“蒙特卡罗树搜索”算法(MCTS)先从蒙特卡罗方法开始:假设我们要计算一个不规则图形的面积。蒙特卡罗方法基于这样的思想:假想你有一袋豆子,把豆子均匀地朝这个图形上撒,然后数这个图形之中有多少颗豆子

7、,这个豆子的数目就是图形的面积。当你的豆子越小,撒的越多的时候,结果就越精确。AlphaGo——什么是蒙特卡罗树搜索(MCTS)?图:计算机蒙特卡罗方法模拟借助计算机程序可以生成大量随机的、均匀分布坐标点,统计出图形内的点数,通过它们占总点数的比例和坐标点生成范围的面积就可以求出图形面积。AlphaGo——什么是蒙特卡罗树搜索(MCTS)?如何让计算机“看懂棋局”:AlphaGo中一个游戏状态的大小是19*19*17。不

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。