天才AI

人工智能里程碑:新AlphaGo Zero横空出世,彻底摆脱人类

发布时间:2017年10月19日 作者:华尔街见闻 浏览量:842

摘要:谷歌人工智能团队DeepMind宣布,新版AlphaGo——AlphaGo Zero可以只在了解比赛的规则,且没有人类指导的情况下自我学习。短短3天,AlphaGo Zero就完胜曾击败世界冠军李世石的AlphaGo。

打败目前人类围棋最高水平选手才过去不久,DeepMind团队又宣布了一个在AI历史上具有里程碑式意义的重磅消息:新版AlphaGo可以彻底摆脱人类的知识。

10月18日,谷歌人工智能团队DeepMind团队在期刊《Nature》上发表论文,宣布新版AlphaGo——AlphaGo Zero可以在没有人类指导的情况下学习。

我们在这里介绍一种仅基于强化学习(reinforcement learning)的算法,没有超越游戏规则的人类数据、指导或领域知识。

也就是说,AlphaGo Zero就像人类初学者一样,只是了解比赛的规则和比赛的最终目标来自我学习。而作为首个击败人类围棋冠军的程序,之前版本的AlphaGo是通过分析人类围棋高手的数千棋局来学习,并在自我对弈中不断强化。

AlphaGo Zero学到的围棋知识(图片来源:DeepMind 论文)
AlphaGo Zero学到的围棋知识(图片来源:DeepMind 论文)

 

此次的亮点在于,AlphaGo Zero无需人类指导就能让自己成为自己的老师,并且训练的时间更短。

短短3天时间,AlphaGo Zero不但从头开始学习了围棋,并且击败了先前版本的AlphaGo。在与击败世界冠军李世石的AlphaGo对弈中,AlphaGo Zero以100:0的比分完胜。

AlphaGo Zero在击败AlphaGo Lee之前,进行了了490万次自我对弈;而AlphaGo Lee的训练时间则是数月。

团队甚至表示,仅仅40天后,AlphaGo Zero已经可以在与最先进版本的AlphaGo对弈中获得90%的胜率了。

AlphaGo Zero和先前版本AlphaGo的表现比较(图片来源:DeepMind 论文)

AlphaGo Zero和先前版本AlphaGo的表现比较(图片来源:DeepMind 论文)

 

此次AlphaGo Zero的出现不仅仅意味着围棋上的成功,还意味着距离通过创建通用算法来解决科学中的难题又进了一步。

目前深度学习需要大量数据,而数据的获得成本高昂且难度十分大,有了这项技术后,人类今后将有可能解决更大的挑战,给人类生活带来根本性的变化。

DeepMind首席执行官Demis Hassabis承认,以运用这个技术解决实际生活中的许多问题。范围可以包括预测蛋白质分子的形状,这也是新药研发过重的重要一环;还可以设计新材料和进行气候建模。

免责声明:本文来自作者——华尔街见闻 ,不代表超天才网的观点和立场。文章及图片来源网络,版权归作者所有,如有投诉请联系删除。

0 0 0

游客 游客

这位投稿者太神秘了,什么都没留下~

超天才网©2017 www.supergenius.cn All Rights Reserved ICP备09005826号 京ICP证130304号

联系我们| 加入我们| 法律声明| 关于我们| 评论互动

超天才网©2013-2014 All Rights Reserved ICP备09005826号 京ICP证130304号

关注我们: