飞扬围棋

 找回密码
 注册
搜索
查看: 11772|回复: 20
打印 上一主题 下一主题

如何看待谷歌人工智能 AI 击败欧洲围棋冠军?

[复制链接]
跳转到指定楼层
1#
发表于 2016-1-28 19:12 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
他们确实做得很好,能让 4 子胜 Zen 和 CrazyStone,把职业二段打成五比零,实力不容质疑。就期待着今年三月他们和李世石的比赛了。

从算法上来说,这篇文章并没有太多新意,主要是通过大量的训练数据,包括以往的棋谱和自我对局,把性能堆出来。他们训练了一个走子的神经网络(这个和我们的办法是一样的,但我们的文章主要在这上面作了改进),又训练了一个可以评估局面的网络(这个我们还没有),然后在蒙特卡罗树搜索中同时使用这两个网络。后者用了两千万局的自我对局 (self-play) 的结果训练。为了避免过拟合,每局只随机选了其中一个局面,然后让网络预测对局结果(胜或负)。两千万局不是个小数字,大家可以算一下一刻不停地下,15 分钟一局需要多久才能下完(大约是 570 年)。这个规模我说实在没有想到过,谷歌在这方面是很有优势的。最后,他们的 default policy 也是经过处理的,能够两微秒走一步而且准确率也不错。还有一些小细节就不一一赘述了。总之,谷歌的做法充分利用了大数据 + 深度学习的优势,而几乎完全没有用到围棋的领域知识,所以若是以后棋力能再往上走,我也不会惊讶。

其实这篇文章在去年 11 月份就已经投稿,但是因为《自然》杂志严格的审查制度,现在才出来。我们在 11 月的时候还只有 3d 的水平,蒙特卡罗树搜索还有各种问题,12 月初的时候已经听到了谣言,当时我惊得话都说不出来了,然而就算这样,还是决定一点一点做,抓紧圣诞和新年的时间,把性能提高到 5d 的水平。我们还差一点拿了一月 KGS 锦标赛的冠军(Zen 和 DolBaram 都参加了),可惜最后因为程序错误而超时,输了一局赢棋给 Zen,得了第三名。谷歌的文章有 20 个作者,明显是下了血本,前两位都是计算机围棋界的大牛,一作 David Silver 是计算机围棋和强化学习的顶级专家,整个博士论文就是做的围棋; 二作 Aja Huang 以前写过多年围棋软件,自己又是 AGA 6D 的水平。相比之下我们只有两个人( @朱岩 ),只做了半年,中间还要穿插 VQA 等其他项目,而且都没有做过围棋的经验,想想有些差距也是不冤了。

现在回想起来,要是他们决定去年 10 月份战胜了樊麾后马上公开,或者我们再拖一会儿,决定不投 ICLR 而等到今年的 ICML,那我们就被灭得连渣都不剩了(笑)。这回虎口拔牙,能从中拿到一些贡献,为公司增加一些影响力,算是比较成功的。至于单挑全军的感觉如何——我的回答是很爽

Facebook 高层也给了我们很大的支持,昨天我们组的老大 Yann LeCun 发了文章介绍我们的工作,扎克伯格还特地发了一篇文章点到了我的名字,赞扬我们的努力,对此我非常感动。

评分

1

查看全部评分

2#
 楼主| 发表于 2016-1-28 19:16 | 只看该作者
最新:据多位顶尖棋手对棋谱的鉴定,认为 AlphaGo 的水平应该在业余强 6 段到弱职业之间,离人类顶尖大概还有一先到两先的差距
回复 支持 反对

使用道具 举报

3#
 楼主| 发表于 2016-1-28 19:25 | 只看该作者
陈晨李树,数学专业 / 计算机专业 / 围棋未入段
邓冠东、王庸、Zacharius 等 116 人赞同
一大早起来被各种新闻刷屏了,看来大家对围棋很感兴趣。

Nature那篇文章的可读性很强。解棋类游戏面临两个问题:搜索深度太深、广度太广。太深,通过构造适当的估值函数来剪枝;太广,通过构造适当的policy来聚焦。

我不清楚之前的围棋AI是怎么实现上面两点。Google说,我们来试试神经网络吧!于是通过职业棋谱学了一个policy,精确度55%;同时学了一个局部常型的policy,为了之后自己和自己下用的,精确度24%。这样我们的程序就可以模仿着高手们的谱着下棋,而不是胡乱落子了。

紧接着是构造评估函数。Google说,我们来试试神经网络吧!(你能不能换一个台词……)就是让计算机根据policy不断地和自己下棋,然后学习判断局面。

Alpha Go碾压其他AI是没有问题的,和职业二段Fan Hui五番棋证明Alpha Go已经进入职业水平。不过BBC肯定是有些标题党了。应该还是有不少人(包括我)对Alpha Go的能力有所怀疑,没有关系,我们等等三月份看僵尸流小李怎么虐Alpha Go吧(笑)。

值得一提的是Alpha Go对战Fan Hui所思考的情况比深蓝对阵卡斯帕罗夫少得多得多(thousands of times fewer positions),因为Alpha Go凭“直觉”挑的待选步更好,对形势的判断能力更高。从这一点说,非常像人类。此外深蓝的估值函数是手写的,而Alpha Go的估值函数是他自己学出来的。
回复 支持 反对

使用道具 举报

4#
发表于 2016-1-28 19:30 | 只看该作者
我是守旧的人,电脑围棋无聊之极,中国象棋就是前车之鉴,也许我无知,研究这要干嘛,谁受益。

点评

公司受益呀  发表于 2016-2-1 18:33
这也透露出谷歌或脸谱(Facebook)公司的长远战略发展方向,绝不仅仅满足于目前的搜索或社交业务,而是投入巨资在人工智能方面,围棋是其中的一部分,这样的公司才有长足的发展后劲,也很可怕,值得中国公司学习。  发表于 2016-1-29 09:45
研究人工智能,其实是研究智能化机器的重要部分吧(想想自动驾驶,这是最贴近生活的了) 而棋类应该是人类思考能力的一个重要体现  发表于 2016-1-28 23:53
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2016-1-28 19:31 | 只看该作者
从李喆的判断来看,这基本就是国内业余顶尖的实力,这样他战胜樊麾也就是很正常的事,虽然樊麾曾是职业二段,但那是上世纪的事,现在混迹欧洲多年,水平肯定有所退步,而且现在的业余顶尖也不比职业低段差。从以往的欧洲围棋水平判断,欧洲顶尖其实也就是国内普通业6的水平,应该与职业顶尖有二子以上的差距。

所以,alphaGo现在只证明了一件事,它至少已经达到业余顶尖的水平。是否能否达到职业顶尖甚至超越,要看三月和李世石的比赛。

不过我看了几盘alphoGo和樊麾的对局,有点忧虑,抛去棋力的水平不谈,计算机最强大的地方是基本没什么勺子(失误),这是计算机恐怖的地方,而人下棋,哪怕再强大的棋手,一盘棋总会出一些勺子,看上次柯洁与李世石的梦百合五番决赛,基本都是错进错出,有些低级失误他们不知道吗?事后当然看的出,但是人脑毕竟不是计算机,总会产生各种各样的错觉,一个错觉出来,一个失误就产生了。计算机可能就没这方面的问题,所以,在稳定性上,计算机可能会比人强很多。所以,我很担心,和李世石的比赛会不会是前半盘李世石大优,后半盘计算机靠捡勺子获胜?

3月马上就要到来,我对这一战很期待,看李世石是成为维护人类尊严的英雄,还是成为计算机战胜人类的一块踏脚石。

另外,alphaGo对我个人也是有影响的,以前还是能很愉快的玩耍围棋的,就算对手用AI我也不怕,但以后未必了,可以想象未来有一天我在网上碰到AI,我也只能默默的打开我的alphaGo来比赛谁的电脑配置更强了。╮(╯_╰)╭

点评

这样网棋的意义就会下降,而线下的围棋交流反而产生了更多的机会,当然也会对围棋教育培训的方式方法产生一定程度的影响。  发表于 2016-1-29 09:48
回复 支持 反对

使用道具 举报

6#
发表于 2016-1-28 20:21 | 只看该作者
太期待了。
我觉得李世石要输。

其实电脑下棋赢了人类,没什么大不了的。
可以说是必然的。早晚的事情。

可能对职业棋手心理上有一定冲击,对业余的,影响不大。
就好比人跑不过汽车,没什么。

回复 支持 反对

使用道具 举报

7#
 楼主| 发表于 2016-1-28 20:30 | 只看该作者
按软件学习的速度,我也预测小李要输
回复 支持 反对

使用道具 举报

8#
发表于 2016-1-28 20:33 | 只看该作者
战胜人类是迟早的事情!但如何好好的利用智能是关键!
回复 支持 反对

使用道具 举报

9#
发表于 2016-1-28 20:39 | 只看该作者
这样也好,我们以后就玩玩碁具吧,不下棋了,看机器人大战
回复 支持 反对

使用道具 举报

10#
发表于 2016-1-28 20:50 | 只看该作者
人造智能应该有情绪反应机制,没有气合怎么有趣啊……
回复 支持 反对

使用道具 举报

11#
发表于 2016-1-28 21:43 | 只看该作者
这不论什么棋呀    是人在下呢   才有意思和意义        如果是两个绝顶的电脑棋神决战于紫禁之巅     关我们人类鸟事      对以下棋为乐的棋迷的鸟蛋有何影响
回复 支持 反对

使用道具 举报

12#
发表于 2016-1-29 05:06 | 只看该作者
我认为李世石会以3:0 获得人-机围棋大战的胜利.
电脑战胜的欧洲围棋冠军充其量相当于我们业余前二十强的水平.不足为虑 !
电脑围棋能战胜职业高段位棋手至少还要十年.

回复 支持 反对

使用道具 举报

13#
发表于 2016-2-1 07:12 | 只看该作者
本帖最后由 肥仔胡 于 2016-2-1 12:22 编辑

电脑开发下棋软件,本意不是为了下棋,而是对人的思维的模拟。据悉其“学习功能”最终将被应用于环保和医疗领域。任何科学 技术的进步都值得赞赏,不管它的开发是出于商业目的,还是别的目的。我们如果怀疑一切,否定一切,满足现状,安于现状,人类的进步从何而来。
回复 支持 反对

使用道具 举报

14#
发表于 2016-2-1 16:25 | 只看该作者
个人感觉现在电脑AI最弱的还是在劫的处理上,不过alphago的自我学习这块不知道能不能弥补,另外其实规则也是一大变数,时间越短对电脑越有利。我估计电脑围棋战胜人类顶尖高手,应该首先在10秒一步的超快棋上。

点评

比速度是无赖  发表于 2016-2-1 18:32
回复 支持 反对

使用道具 举报

15#
发表于 2016-2-1 16:35 | 只看该作者
alphago有自学能力?无限制涨棋?我觉得不会有,否则谁也下不过它!它也只是监督学习+强化学习,不可能无限制的涨棋!三月的大战我肯定买李世石,虽然迟早下不过电脑,但是没这么快。。。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2024-11-30 03:37 , Processed in 0.167290 second(s), 20 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表