如何看待谷歌人工智能 AI 击败欧洲围棋冠军？

棋实 · 发表于 2016-1-28 19:12

他们确实做得很好，能让 4 子胜 Zen 和 CrazyStone，把职业二段打成五比零，实力不容质疑。就期待着今年三月他们和李世石的比赛了。

从算法上来说，这篇文章并没有太多新意，主要是通过大量的训练数据，包括以往的棋谱和自我对局，把性能堆出来。他们训练了一个走子的神经网络（这个和我们的办法是一样的，但我们的文章主要在这上面作了改进），又训练了一个可以评估局面的网络（这个我们还没有），然后在蒙特卡罗树搜索中同时使用这两个网络。后者用了两千万局的自我对局 (self-play) 的结果训练。为了避免过拟合，每局只随机选了其中一个局面，然后让网络预测对局结果（胜或负）。两千万局不是个小数字，大家可以算一下一刻不停地下，15 分钟一局需要多久才能下完（大约是 570 年）。这个规模我说实在没有想到过，谷歌在这方面是很有优势的。最后，他们的 default policy 也是经过处理的，能够两微秒走一步而且准确率也不错。还有一些小细节就不一一赘述了。总之，谷歌的做法充分利用了大数据 + 深度学习的优势，而几乎完全没有用到围棋的领域知识，所以若是以后棋力能再往上走，我也不会惊讶。

其实这篇文章在去年 11 月份就已经投稿，但是因为《自然》杂志严格的审查制度，现在才出来。我们在 11 月的时候还只有 3d 的水平，蒙特卡罗树搜索还有各种问题，12 月初的时候已经听到了谣言，当时我惊得话都说不出来了，然而就算这样，还是决定一点一点做，抓紧圣诞和新年的时间，把性能提高到 5d 的水平。我们还差一点拿了一月 KGS 锦标赛的冠军（Zen 和 DolBaram 都参加了），可惜最后因为程序错误而超时，输了一局赢棋给 Zen，得了第三名。谷歌的文章有 20 个作者，明显是下了血本，前两位都是计算机围棋界的大牛，一作 David Silver 是计算机围棋和强化学习的顶级专家，整个博士论文就是做的围棋; 二作 Aja Huang 以前写过多年围棋软件，自己又是 AGA 6D 的水平。相比之下我们只有两个人（ @朱岩 )，只做了半年，中间还要穿插 VQA 等其他项目，而且都没有做过围棋的经验，想想有些差距也是不冤了。

现在回想起来，要是他们决定去年 10 月份战胜了樊麾后马上公开，或者我们再拖一会儿，决定不投 ICLR 而等到今年的 ICML，那我们就被灭得连渣都不剩了（笑）。这回虎口拔牙，能从中拿到一些贡献，为公司增加一些影响力，算是比较成功的。至于单挑全军的感觉如何——我的回答是很爽

Facebook 高层也给了我们很大的支持，昨天我们组的老大 Yann LeCun 发了文章介绍我们的工作，扎克伯格还特地发了一篇文章点到了我的名字，赞扬我们的努力，对此我非常感动。

棋实 · 发表于 2016-1-28 19:16

最新：据多位顶尖棋手对棋谱的鉴定，认为 AlphaGo 的水平应该在业余强 6 段到弱职业之间，离人类顶尖大概还有一先到两先的差距

棋实 · 发表于 2016-1-28 19:25

陈晨李树，数学专业 / 计算机专业 / 围棋未入段
邓冠东、王庸、Zacharius 等 116 人赞同
一大早起来被各种新闻刷屏了，看来大家对围棋很感兴趣。

Nature那篇文章的可读性很强。解棋类游戏面临两个问题：搜索深度太深、广度太广。太深，通过构造适当的估值函数来剪枝；太广，通过构造适当的policy来聚焦。

我不清楚之前的围棋AI是怎么实现上面两点。Google说，我们来试试神经网络吧！于是通过职业棋谱学了一个policy，精确度55%；同时学了一个局部常型的policy，为了之后自己和自己下用的，精确度24%。这样我们的程序就可以模仿着高手们的谱着下棋，而不是胡乱落子了。

紧接着是构造评估函数。Google说，我们来试试神经网络吧！（你能不能换一个台词……）就是让计算机根据policy不断地和自己下棋，然后学习判断局面。

Alpha Go碾压其他AI是没有问题的，和职业二段Fan Hui五番棋证明Alpha Go已经进入职业水平。不过BBC肯定是有些标题党了。应该还是有不少人（包括我）对Alpha Go的能力有所怀疑，没有关系，我们等等三月份看僵尸流小李怎么虐Alpha Go吧（笑）。

值得一提的是Alpha Go对战Fan Hui所思考的情况比深蓝对阵卡斯帕罗夫少得多得多（thousands of times fewer positions），因为Alpha Go凭“直觉”挑的待选步更好，对形势的判断能力更高。从这一点说，非常像人类。此外深蓝的估值函数是手写的，而Alpha Go的估值函数是他自己学出来的。

熠熠生辉 · 发表于 2016-1-28 19:30

我是守旧的人，电脑围棋无聊之极，中国象棋就是前车之鉴，也许我无知，研究这要干嘛，谁受益。

棋实 · 发表于 2016-1-28 19:31

从李喆的判断来看，这基本就是国内业余顶尖的实力，这样他战胜樊麾也就是很正常的事，虽然樊麾曾是职业二段，但那是上世纪的事，现在混迹欧洲多年，水平肯定有所退步，而且现在的业余顶尖也不比职业低段差。从以往的欧洲围棋水平判断，欧洲顶尖其实也就是国内普通业6的水平，应该与职业顶尖有二子以上的差距。

所以，alphaGo现在只证明了一件事，它至少已经达到业余顶尖的水平。是否能否达到职业顶尖甚至超越，要看三月和李世石的比赛。

不过我看了几盘alphoGo和樊麾的对局，有点忧虑，抛去棋力的水平不谈，计算机最强大的地方是基本没什么勺子（失误），这是计算机恐怖的地方，而人下棋，哪怕再强大的棋手，一盘棋总会出一些勺子，看上次柯洁与李世石的梦百合五番决赛，基本都是错进错出，有些低级失误他们不知道吗？事后当然看的出，但是人脑毕竟不是计算机，总会产生各种各样的错觉，一个错觉出来，一个失误就产生了。计算机可能就没这方面的问题，所以，在稳定性上，计算机可能会比人强很多。所以，我很担心，和李世石的比赛会不会是前半盘李世石大优，后半盘计算机靠捡勺子获胜？

3月马上就要到来，我对这一战很期待，看李世石是成为维护人类尊严的英雄，还是成为计算机战胜人类的一块踏脚石。

另外，alphaGo对我个人也是有影响的，以前还是能很愉快的玩耍围棋的，就算对手用AI我也不怕，但以后未必了，可以想象未来有一天我在网上碰到AI，我也只能默默的打开我的alphaGo来比赛谁的电脑配置更强了。╮(╯_╰)╭

Russel0 · 发表于 2016-1-28 20:21

太期待了。
我觉得李世石要输。

其实电脑下棋赢了人类，没什么大不了的。
可以说是必然的。早晚的事情。

可能对职业棋手心理上有一定冲击，对业余的，影响不大。
就好比人跑不过汽车，没什么。

棋实 · 发表于 2016-1-28 20:30

按软件学习的速度，我也预测小李要输

工作太累yyq · 发表于 2016-1-28 20:33

战胜人类是迟早的事情！但如何好好的利用智能是关键！

whay · 发表于 2016-1-28 20:39

这样也好，我们以后就玩玩碁具吧，不下棋了，看机器人大战

bighippo · 发表于 2016-1-28 20:50

人造智能应该有情绪反应机制，没有气合怎么有趣啊……

明月白驼 · 发表于 2016-1-28 21:43

这不论什么棋呀是人在下呢才有意思和意义如果是两个绝顶的电脑棋神决战于紫禁之巅关我们人类鸟事对以下棋为乐的棋迷的鸟蛋有何影响

caoqian0713 · 发表于 2016-1-29 05:06

我认为李世石会以3:0 获得人-机围棋大战的胜利.
电脑战胜的欧洲围棋冠军充其量相当于我们业余前二十强的水平.不足为虑 !
电脑围棋能战胜职业高段位棋手至少还要十年.

肥仔胡 · 发表于 2016-2-1 07:12

本帖最后由肥仔胡于 2016-2-1 12:22 编辑

电脑开发下棋软件，本意不是为了下棋，而是对人的思维的模拟。据悉其“学习功能”最终将被应用于环保和医疗领域。任何科学技术的进步都值得赞赏，不管它的开发是出于商业目的，还是别的目的。我们如果怀疑一切，否定一切，满足现状，安于现状，人类的进步从何而来。

胖刺头 · 发表于 2016-2-1 16:25

个人感觉现在电脑AI最弱的还是在劫的处理上，不过alphago的自我学习这块不知道能不能弥补，另外其实规则也是一大变数，时间越短对电脑越有利。我估计电脑围棋战胜人类顶尖高手，应该首先在10秒一步的超快棋上。

卓然无双 · 发表于 2016-2-1 16:35

alphago有自学能力？无限制涨棋？我觉得不会有，否则谁也下不过它！它也只是监督学习+强化学习，不可能无限制的涨棋！三月的大战我肯定买李世石，虽然迟早下不过电脑，但是没这么快。。。

帐号		自动登录	找回密码
密码			注册

如何看待谷歌人工智能 AI 击败欧洲围棋冠军？

评分

点评

点评

点评