flyingsee 发表于 2022-2-18 10:06

柯洁轻灵一跳超越AI一选,打脸以AI一选衡量妙手论者

本帖最后由 flyingsee 于 2022-4-13 11:27 编辑

2022年2月16日,天元战32强战,柯洁执黑207手战胜对手伊凌涛。其中,黑第169手轻灵的一跳,是绝妙一手。如下图(转自贴吧)
http://tiebapic.baidu.com/forum/w%3D580/sign=ffa43dec3eec54e741ec1a1689399bfd/3320ab18972bd407eb61632f3e899e510eb30946.jpg

小九围棋(职业棋手三段)在本局讲解视频中详细讲解了此处变化。
【伊凌涛深入敌营 一决胜负 大龙对杀 柯洁祭出惊人绝杀妙手】(转自b站)
https://www.bilibili.com/video/BV1tb4y147JL
(该视频7分钟左右开始讲解)

在直播过程中,对于第169手黑棋,绝艺和星阵当时一选都是扳那两个子。

katago 40b461k的计算结果如下图(转自贴吧)
http://tiebapic.baidu.com/forum/w%3D580/sign=868cfe120e43fbf2c52ca62b807fca1e/a539f8dcd100baa18dc19ca11a10b912c8fc2e3b.jpg


柯洁下出的169,超越了AI一选,是惊人的妙手,再次无可辩驳的证明,以AI一选评价人类妙手是何等可笑。

柯洁的妙手,直接打脸一众以AI一选衡量妙手论者。

除此以外,

在百度围棋贴吧,有些以AI一选衡量妙手的人,也恰恰在相关讨论中,同时被网友打脸。

例如这个帖子:

https://tieba.baidu.com/p/7727996319








发信人: GunL (大尾巴狼), 信区: Weiqi
标题: Re: 感受到了好显卡的能力,附带一个局面测试
发信站: 水木社区 (Mon Apr 15 16:34:24 2019), 转信

例子不错,很有典型意义。
这种局面在星阵的算法设计中被称为AI的盲点盘面。楼主给的例子,是当前盘面的一招妙手
未被发掘出来;更普遍的情况,是一些看似正常的着手也会看不见。比如附图中的M3虎。

盲点盘面的存在是非常普遍的情况。可以说,几乎每天的人类棋谱中,都会出现很多AI的盲
点盘面。

导致盲点盘面的原因有几类。第一类就是大家通常认为的,AI的水平还不够,不能发现某些
隐藏的妙手。通过持续的强化学习,这类着手会被逐渐发掘出来。当然,计算能力的提升,
比如使用更强的硬件,也相当于提升了AI的水平;
另一类是训练数据造成的。随机性不足的、来源单一化的棋谱数据会造成神经网络模型对某
些没见过的盘面、形状缺乏认识,没有敏感度;
还有一类是系统性的,比如使用的神经网络结构参数不够多,描述能力不足;或者网络构型
本身就解决不了某些盘面——比如使用线性模型去拟合目标函数,那一个(线性)偏离其他
样本群很远的样本,是注定拟合不好的。

我们已经确信,有些盲点盘面是最后一个原因造成的。这些盘面下,无论是绝艺、星阵、
Elf OpenGo、LeelaZero,都不能找出正确的、并不算难的应手。而上述这些AI的训练数据
并没有交集,所以它只能是系统性的问题——或者可以直接猜测,这是使用Resnet带来的问
题?
对盲点盘面问题的研究,可以使AI算法工作者更清晰地看到,AlphaGo Zero算法的局限性和
天花板。


【 在 daxuebeng (飞翔) 的大作中提到: 】
: 整了一个云上免费的Tesla V100,速度真是快呀,瞬间几万po
: 顺便测试了一下若干年前古力对芈昱廷的百灵杯决赛的一局棋,印象很深,想看看现在
: 的软件能发现这种妙手吗?以前自己的显卡太烂,说服力不足。现在看来确实这种妙手
: ...................



flyingsee 发表于 2022-2-18 10:15



flyingsee 发表于 2022-2-18 10:16

高粱米 发表于 2022-2-18 11:59

本帖最后由 高粱米 于 2022-2-18 15:45 编辑

我自己跑了几遍.... Katago 40B
在第168手, 我跑了2000K的计算量, 扳是一选, 胜率大概82%-83%; 柯洁的跳是二选, 胜率大概 72%-73%.
以下按照全局 600K 的计算量,
若走扳黑棋胜率 81.7%
若走柯洁的跳, 我跑了两遍, 两次的胜率差0.1%, 第一次白棋胜率是24.6%, 下一步的黑棋一选是 H8 单粘; 第二次白棋胜率是24.7%, 下一步黑棋的一选是 H12 刺; 但是第一次 H12 的胜率和 H8 比差挺多, 第二次 H8 的胜率比 H12 也差挺多.
就169手而言, 胜率并没有什么问题. 如果真的出现盲点, 胜率会有大的波动. 事实上这一手并没有大波动.
AI的选点和胜率随着计算量的上升, 是会变化的. 我认为AI的问题在于权重和计算量; 权重显示的是AI的训练程度, 也就是说这个AI体质如何;计算量自不必说, 越大越精确. 要说打脸不打脸的, 摆出权重和计算量比比再说.
有更好的权重和更大的计算量来推翻我这个, 我也认.

flyingsee 发表于 2022-2-18 13:33

高粱米 发表于 2022-2-18 11:59
我自己跑了几遍.... Katago 40B
在第168手, 我跑了2000K的计算量, 扳是一选, 胜率大概82%-83%; 柯洁的跳是 ...

您的结论是什么?

高粱米 发表于 2022-2-18 15:44

高粱米 发表于 2022-2-18 11:59
我自己跑了几遍.... Katago 40B
在第168手, 我跑了2000K的计算量, 扳是一选, 胜率大概82%-83%; 柯洁的跳是 ...

文中柯洁跳之后的两个胜率24.6%和24.7%是白棋胜率.

高粱米 发表于 2022-2-18 15:50

flyingsee 发表于 2022-2-18 13:33
您的结论是什么?

我的结论是, 柯洁的选点实际上在 AI 的选点以内, 从胜率上来说, 并没有优于 AI 的一选, 所以单纯从围棋的技术性角度, 谈不上惊人的妙手.

我以胜率来衡量过妙手; 我以为, 妙手无须是 AI 一选, 但是如果造成了胜率的大幅度下跌(20个点以上)的着法, 从技术性的角度, 无论如何也谈不上是妙手.

肥仔胡 发表于 2022-2-18 16:59

其实flying兄和高梁兄不必为棋力争执不休,完全是被一帮投机分子带偏了。我只要他们回答古代规则后走多9目判输棋的合理性,其他什么棋力也没什么可谈的。因为古今棋力之争,加上劈头盖脸的人格攻击和虚构罪名,归根到底要落实到“取代”和“颠覆”现行新中国围棋体制上来,那就请他们解释一下面积大的一方,而且还是后走吃亏的情况下,被规则杀死的原因。我从不像他们捕风捉影,“奴性”“颠覆和取代”是他们自己在表演。

flyingsee 发表于 2022-2-18 17:25

本帖最后由 flyingsee 于 2022-2-18 17:36 编辑

高粱米 发表于 2022-2-18 15:50
我的结论是, 柯洁的选点实际上在 AI 的选点以内, 从胜率上来说, 并没有优于 AI 的一选, 所以单纯从围棋的 ...
这手棋在人类棋手眼里为什么是“妙手”,前面已经有视频讲解了,自己去看。


那我来告诉你为什么网上的棋友们把这一手叫惊人妙手,也就是告诉你为什么我说它“超越AI一选”


第一,这一手棋,在直播过程中,星阵、野狐的AI,以及B站直播的木上野狐开了高算力的katago,都不在上述AI的一选之中。既然不在ai一选,则必然是“降胜率”的一手。

第二,不管这些AI一开始怎么评价这手棋降了多少个胜率,经过深入计算以后,这一手棋的胜率迅速上升,明显超过一开始AI给的胜率。(这也是网友们认为这一手是AI盲点的原因)也就是说,柯洁这手棋是AI的盲点——当时直播的效果就是这样。

第三,在棋盘上的实际效果是,这一手下出以后,因为构思的巧妙,它不仅是AI的“盲点”,也是对手的“盲点”,对手没有考虑到柯洁下这一手。这种给对手也造成的心理冲击很大,这之后,黑棋下的越来越顺手,白棋则最终坚持了不到20手(双方总共不到40手)认输。

上面这个过程,就是包括职业棋手在内的观战者,对这一手从一开始粗略的看到“降胜率”、然后又戏剧性的发现它很巧妙,最终,大家认为它“妙手”“绝妙”“惊人绝杀妙手”的过程。

这就告诉我们,谁说妙手就必须是AI一选?

这个过程本身,就打脸那些单纯以AI胜率一选衡量妙手与否的人们。

所以网友们评论说,柯洁在教AI下棋云云。我看说的没错,人类就是有人类的创造性。



另外,所谓这一点原本就在AI选点范围云云,这种废话没有任何意义。棋盘上走到168手,值得下的范围就那么大,可选点都在AI选点范围不是很正常的事情吗?问题是对于野狐、星阵AI,它们一开始给的胜率给低了,柯洁下出来以后才又升高的。你拿katago40b跑2000k算的结果跟我们说的就不是一回事,也不是一个过程。您要真悠闲您拿60b跑跑。

最后,你说一千道一万,反正有人是在贴吧被打脸了,piapia的。谁疼谁知道。我反正就是正常晒个截图。

高粱米 发表于 2022-2-18 18:21

flyingsee 发表于 2022-2-18 17:25
这手棋在人类棋手眼里为什么是“妙手”,前面已经有视频讲解了,自己去看。




用 60B 跑更没问题了, 图片是我跑的结果, 柯洁的跳就是 AI 一选, 这更验证了我的说法: AI 的问题就在于权重和运算量. 权重高运算量大就准确.野狐直播的 AI 使用 6K 的运算量, 星阵和弈客不清楚.

flyingsee 发表于 2022-2-18 18:43

本帖最后由 flyingsee 于 2022-2-18 18:50 编辑

高粱米 发表于 2022-2-18 18:21
用 60B 跑更没问题了, 图片是我跑的结果, 柯洁的跳就是 AI 一选, 这更验证了我的说法: AI 的问题就在于权 ...
然后呢?

您再次证明了柯洁的下法是“超越AI”——不过不是您这个AI,而是在当时观战时的人们所使用的的类似野狐、星阵和katago40b那种AI

脱离的具体语境,用自己定义的概念来解释别人的概念,这有什么用呢?

是不是没明白我的意思?

换句话说吧,那些拿着低端AI去否定人类所下的妙手的人,用的是您这套权重和计算量吗?

如果不是的话,这事跟您还有什么关系吗?

再者说了,今天您用60b一选否定了40b一选,明天呢?

你能否从真理的角度,来彻底否定不可能将来有个80b否定你这个60b的计算结果?

高粱米 发表于 2022-2-18 19:13

flyingsee 发表于 2022-2-18 18:43
然后呢?

您再次证明了柯洁的下法是“超越AI”——不过不是您这个AI,而是在当时观战时的人们所使用的 ...

现在的 AI 的技术路线就决定了, 它只能随着神经网络的训练和算力的堆砌而接近"围棋上帝"(假设我们有一个全知全能的围棋上帝). 您说的是对的, 以后有可能会有 80B 的权重的 AI 再来否定 60B 权重的 AI, 就看相关的 AI 技术玩家是不是有兴趣和资源去训练了.
您说得对, 用低端 AI 去做评判, 是不能言之凿凿的; 但是如果选点跑得全面一点, AI 配置高点, 计算量高点儿, 我还是更倾向于 AI 的判断.


非要追根究底的话, 一手棋到底好不好, 在没有"围棋上帝"来做裁决的情况之下, 只能"实战解决": 谁觉得行谁来, 谁牛谁说了算. AI 也有盲点, 但是不能据此说 AI 的评判就比人的判断不可靠, 不能因为人发现了一个 AI 的盲点就说 AI 不如人. 哪怕就柯洁那盘棋, 下完169手, 把伊凌涛换下来, 让野狐直播的 AI 上, 柯洁八成也是要输的; 当然了, 这也是没法验证的了.


flyingsee 发表于 2022-2-18 19:17

高粱米 发表于 2022-2-18 19:13
现在的 AI 的技术路线就决定了, 它只能随着神经网络的训练和算力的堆砌而接近"围棋上帝"(假设我们有一个 ...
您可一定搞清楚,我们讨论的缘由,不是说用人下的去否定AI

谁也没说要否定AI

现在是有人用AI去否定人

而我们不同意后者,不同意后者不代表就要否定AI

高粱米 发表于 2022-2-18 19:30

flyingsee 发表于 2022-2-18 19:17
您可一定搞清楚,我们讨论的缘由,不是说用人下的去否定AI

谁也没说要否定AI


我们讨论的缘由不就是用 AI 去判断妙手是不是合适吗? 我的观点是, 以 AI 一选作为妙手唯一标准是不可取的; 但是AI 判断下的"错着"(我的错着的标准是胜率下降 20个点)应该不能判断为妙手, 哪怕因为人的因素, 使得这手棋取得了意想不到的结果, 那也只能视为"骗招".

当然, 因为技术的原因, 会导致 AI 的判断不是完全准确, 那么我们就应该更全面地来使用这个技术, 尽量减小这个不准确.

我对于用 AI 来判断古人的棋力也不置可否, 一方面不想争, 另一方面我认为古棋规则下的围棋和现在的围棋并不是一个游戏.

一个时代有一个时代的最强者, 但是围棋技术是发展的, 我们是"站在巨人肩膀上", 所以我们现在的职业选手比古人要强得多的. 但是我们没有理由鄙视他们. 打个比方吧, 现在很多大学生, 微积分比牛顿好得多, 但是他们是吸收了几百年以来的数学家的成就, 真要我说这些大学生比牛顿微积分强, 恐怕是没这个脸的.

flyingsee 发表于 2022-2-18 19:36

本帖最后由 flyingsee 于 2022-2-18 19:39 编辑

说起“错招”,您说的我大部分都赞成。

问题是有些人就是在搞双标。

比如对这个图里的错招的平均值,视而不见



https://pic1.zhimg.com/80/v2-d27a7b3201ea163260b87fd5dc84eafc_720w.jpg

页: [1] 2
查看完整版本: 柯洁轻灵一跳超越AI一选,打脸以AI一选衡量妙手论者