人工智能里程碑：新AlphaGo Zero横空出世，彻底摆脱人类—

发布时间:2017年10月19日作者：华尔街见闻浏览量：1,008

摘要：谷歌人工智能团队DeepMind宣布，新版AlphaGo——AlphaGo Zero可以只在了解比赛的规则，且没有人类指导的情况下自我学习。短短3天，AlphaGo Zero就完胜曾击败世界冠军李世石的AlphaGo。

打败目前人类围棋最高水平选手才过去不久，DeepMind团队又宣布了一个在AI历史上具有里程碑式意义的重磅消息：新版AlphaGo可以彻底摆脱人类的知识。

10月18日，谷歌人工智能团队DeepMind团队在期刊《Nature》上发表论文，宣布新版AlphaGo——AlphaGo Zero可以在没有人类指导的情况下学习。

我们在这里介绍一种仅基于强化学习（reinforcement learning）的算法，没有超越游戏规则的人类数据、指导或领域知识。

也就是说，AlphaGo Zero就像人类初学者一样，只是了解比赛的规则和比赛的最终目标来自我学习。而作为首个击败人类围棋冠军的程序，之前版本的AlphaGo是通过分析人类围棋高手的数千棋局来学习，并在自我对弈中不断强化。

AlphaGo Zero学到的围棋知识（图片来源：DeepMind 论文）

此次的亮点在于，AlphaGo Zero无需人类指导就能让自己成为自己的老师，并且训练的时间更短。

短短3天时间，AlphaGo Zero不但从头开始学习了围棋，并且击败了先前版本的AlphaGo。在与击败世界冠军李世石的AlphaGo对弈中，AlphaGo Zero以100:0的比分完胜。

AlphaGo Zero在击败AlphaGo Lee之前，进行了了490万次自我对弈；而AlphaGo Lee的训练时间则是数月。

团队甚至表示，仅仅40天后，AlphaGo Zero已经可以在与最先进版本的AlphaGo对弈中获得90%的胜率了。

AlphaGo Zero和先前版本AlphaGo的表现比较（图片来源：DeepMind 论文）

此次AlphaGo Zero的出现不仅仅意味着围棋上的成功，还意味着距离通过创建通用算法来解决科学中的难题又进了一步。

目前深度学习需要大量数据，而数据的获得成本高昂且难度十分大，有了这项技术后，人类今后将有可能解决更大的挑战，给人类生活带来根本性的变化。

DeepMind首席执行官Demis Hassabis承认，以运用这个技术解决实际生活中的许多问题。范围可以包括预测蛋白质分子的形状，这也是新药研发过重的重要一环；还可以设计新材料和进行气候建模。

免责声明：本文来自作者——华尔街见闻，不代表超天才网的观点和立场。文章及图片来源网络，版权归作者所有，如有投诉请联系删除。

匿名

游客

这位投稿者太神秘了，什么都没留下~

登录