飞扬围棋

标题: 柯洁轻灵一跳超越AI一选,打脸以AI一选衡量妙手论者 [打印本页]

作者: flyingsee    时间: 2022-2-18 10:06
标题: 柯洁轻灵一跳超越AI一选,打脸以AI一选衡量妙手论者
本帖最后由 flyingsee 于 2022-4-13 11:27 编辑

2022年2月16日,天元战32强战,柯洁执黑207手战胜对手伊凌涛。其中,黑第169手轻灵的一跳,是绝妙一手。如下图(转自贴吧)


小九围棋(职业棋手三段)在本局讲解视频中详细讲解了此处变化。
【伊凌涛深入敌营 一决胜负 大龙对杀 柯洁祭出惊人绝杀妙手】(转自b站)
https://www.bilibili.com/video/BV1tb4y147JL
(该视频7分钟左右开始讲解)

在直播过程中,对于第169手黑棋,绝艺和星阵当时一选都是扳那两个子。

katago 40b  461k的计算结果如下图(转自贴吧)



柯洁下出的169,超越了AI一选,是惊人的妙手,再次无可辩驳的证明,以AI一选评价人类妙手是何等可笑。

柯洁的妙手,直接打脸一众以AI一选衡量妙手论者。

除此以外,

在百度围棋贴吧,有些以AI一选衡量妙手的人,也恰恰在相关讨论中,同时被网友打脸。

例如这个帖子:

https://tieba.baidu.com/p/7727996319








发信人: GunL (大尾巴狼), 信区: Weiqi
标  题: Re: 感受到了好显卡的能力,附带一个局面测试
发信站: 水木社区 (Mon Apr 15 16:34:24 2019), 转信

例子不错,很有典型意义。
这种局面在星阵的算法设计中被称为AI的盲点盘面。楼主给的例子,是当前盘面的一招妙手
未被发掘出来;更普遍的情况,是一些看似正常的着手也会看不见。比如附图中的M3虎。

盲点盘面的存在是非常普遍的情况。可以说,几乎每天的人类棋谱中,都会出现很多AI的盲
点盘面。

导致盲点盘面的原因有几类。第一类就是大家通常认为的,AI的水平还不够,不能发现某些
隐藏的妙手。通过持续的强化学习,这类着手会被逐渐发掘出来。当然,计算能力的提升,
比如使用更强的硬件,也相当于提升了AI的水平;
另一类是训练数据造成的。随机性不足的、来源单一化的棋谱数据会造成神经网络模型对某
些没见过的盘面、形状缺乏认识,没有敏感度;
还有一类是系统性的,比如使用的神经网络结构参数不够多,描述能力不足;或者网络构型
本身就解决不了某些盘面——比如使用线性模型去拟合目标函数,那一个(线性)偏离其他
样本群很远的样本,是注定拟合不好的。

我们已经确信,有些盲点盘面是最后一个原因造成的。这些盘面下,无论是绝艺、星阵、
Elf OpenGo、LeelaZero,都不能找出正确的、并不算难的应手。而上述这些AI的训练数据
并没有交集,所以它只能是系统性的问题——或者可以直接猜测,这是使用Resnet带来的问
题?
对盲点盘面问题的研究,可以使AI算法工作者更清晰地看到,AlphaGo Zero算法的局限性和
天花板。


【 在 daxuebeng (飞翔) 的大作中提到: 】
: 整了一个云上免费的Tesla V100,速度真是快呀,瞬间几万po
: 顺便测试了一下若干年前古力对芈昱廷的百灵杯决赛的一局棋,印象很深,想看看现在
: 的软件能发现这种妙手吗?以前自己的显卡太烂,说服力不足。现在看来确实这种妙手
: ...................




作者: flyingsee    时间: 2022-2-18 10:15
[attach]179104[/attach]
[attach]179105[/attach]

作者: flyingsee    时间: 2022-2-18 10:16
[attach]179106[/attach]
作者: 高粱米    时间: 2022-2-18 11:59
本帖最后由 高粱米 于 2022-2-18 15:45 编辑

我自己跑了几遍.... Katago 40B
在第168手, 我跑了2000K的计算量, 扳是一选, 胜率大概82%-83%; 柯洁的跳是二选, 胜率大概 72%-73%.
以下按照全局 600K 的计算量,
若走扳黑棋胜率 81.7%
若走柯洁的跳, 我跑了两遍, 两次的胜率差0.1%, 第一次白棋胜率是24.6%, 下一步的黑棋一选是 H8 单粘; 第二次白棋胜率是24.7%, 下一步黑棋的一选是 H12 刺; 但是第一次 H12 的胜率和 H8 比差挺多, 第二次 H8 的胜率比 H12 也差挺多.
就169手而言, 胜率并没有什么问题. 如果真的出现盲点, 胜率会有大的波动. 事实上这一手并没有大波动.
AI的选点和胜率随着计算量的上升, 是会变化的. 我认为AI的问题在于权重和计算量; 权重显示的是AI的训练程度, 也就是说这个AI体质如何;  计算量自不必说, 越大越精确. 要说打脸不打脸的, 摆出权重和计算量比比再说.
有更好的权重和更大的计算量来推翻我这个, 我也认.

作者: flyingsee    时间: 2022-2-18 13:33
高粱米 发表于 2022-2-18 11:59
我自己跑了几遍.... Katago 40B
在第168手, 我跑了2000K的计算量, 扳是一选, 胜率大概82%-83%; 柯洁的跳是 ...

您的结论是什么?
作者: 高粱米    时间: 2022-2-18 15:44
高粱米 发表于 2022-2-18 11:59
我自己跑了几遍.... Katago 40B
在第168手, 我跑了2000K的计算量, 扳是一选, 胜率大概82%-83%; 柯洁的跳是 ...

文中柯洁跳之后的两个胜率24.6%和24.7%是白棋胜率.
作者: 高粱米    时间: 2022-2-18 15:50
flyingsee 发表于 2022-2-18 13:33
您的结论是什么?

我的结论是, 柯洁的选点实际上在 AI 的选点以内, 从胜率上来说, 并没有优于 AI 的一选, 所以单纯从围棋的技术性角度, 谈不上惊人的妙手.

我以胜率来衡量过妙手; 我以为, 妙手无须是 AI 一选, 但是如果造成了胜率的大幅度下跌(20个点以上)的着法, 从技术性的角度, 无论如何也谈不上是妙手.

作者: 肥仔胡    时间: 2022-2-18 16:59
其实flying兄和高梁兄不必为棋力争执不休,完全是被一帮投机分子带偏了。我只要他们回答古代规则后走多9目判输棋的合理性,其他什么棋力也没什么可谈的。因为古今棋力之争,加上劈头盖脸的人格攻击和虚构罪名,归根到底要落实到“取代”和“颠覆”现行新中国围棋体制上来,那就请他们解释一下面积大的一方,而且还是后走吃亏的情况下,被规则杀死的原因。我从不像他们捕风捉影,“奴性”“颠覆和取代”是他们自己在表演。
作者: flyingsee    时间: 2022-2-18 17:25
本帖最后由 flyingsee 于 2022-2-18 17:36 编辑
高粱米 发表于 2022-2-18 15:50
我的结论是, 柯洁的选点实际上在 AI 的选点以内, 从胜率上来说, 并没有优于 AI 的一选, 所以单纯从围棋的 ...

这手棋在人类棋手眼里为什么是“妙手”,前面已经有视频讲解了,自己去看。


那我来告诉你为什么网上的棋友们把这一手叫惊人妙手,也就是告诉你为什么我说它“超越AI一选”


第一,这一手棋,在直播过程中,星阵、野狐的AI,以及B站直播的木上野狐开了高算力的katago,都不在上述AI的一选之中。既然不在ai一选,则必然是“降胜率”的一手。

第二,不管这些AI一开始怎么评价这手棋降了多少个胜率,经过深入计算以后,这一手棋的胜率迅速上升,明显超过一开始AI给的胜率。(这也是网友们认为这一手是AI盲点的原因)也就是说,柯洁这手棋是AI的盲点——当时直播的效果就是这样。

第三,在棋盘上的实际效果是,这一手下出以后,因为构思的巧妙,它不仅是AI的“盲点”,也是对手的“盲点”,对手没有考虑到柯洁下这一手。这种给对手也造成的心理冲击很大,这之后,黑棋下的越来越顺手,白棋则最终坚持了不到20手(双方总共不到40手)认输。

上面这个过程,就是包括职业棋手在内的观战者,对这一手从一开始粗略的看到“降胜率”、然后又戏剧性的发现它很巧妙,最终,大家认为它“妙手”“绝妙”“惊人绝杀妙手”的过程。

这就告诉我们,谁说妙手就必须是AI一选?

这个过程本身,就打脸那些单纯以AI胜率一选衡量妙手与否的人们。

所以网友们评论说,柯洁在教AI下棋云云。我看说的没错,人类就是有人类的创造性。



另外,所谓这一点原本就在AI选点范围云云,这种废话没有任何意义。棋盘上走到168手,值得下的范围就那么大,可选点都在AI选点范围不是很正常的事情吗?问题是对于野狐、星阵AI,它们一开始给的胜率给低了,柯洁下出来以后才又升高的。你拿katago40b跑2000k算的结果跟我们说的就不是一回事,也不是一个过程。您要真悠闲您拿60b跑跑。

最后,你说一千道一万,反正有人是在贴吧被打脸了,piapia的。谁疼谁知道。我反正就是正常晒个截图。
作者: 高粱米    时间: 2022-2-18 18:21
flyingsee 发表于 2022-2-18 17:25
这手棋在人类棋手眼里为什么是“妙手”,前面已经有视频讲解了,自己去看。

用 60B 跑更没问题了, 图片是我跑的结果, 柯洁的跳就是 AI 一选, 这更验证了我的说法: AI 的问题就在于权重和运算量. 权重高运算量大就准确.  野狐直播的 AI 使用 6K 的运算量, 星阵和弈客不清楚.
作者: flyingsee    时间: 2022-2-18 18:43
本帖最后由 flyingsee 于 2022-2-18 18:50 编辑
高粱米 发表于 2022-2-18 18:21
用 60B 跑更没问题了, 图片是我跑的结果, 柯洁的跳就是 AI 一选, 这更验证了我的说法: AI 的问题就在于权 ...

然后呢?

您再次证明了柯洁的下法是“超越AI”——不过不是您这个AI,而是在当时观战时的人们所使用的的类似野狐、星阵和katago40b那种AI

脱离的具体语境,用自己定义的概念来解释别人的概念,这有什么用呢?

是不是没明白我的意思?

换句话说吧,那些拿着低端AI去否定人类所下的妙手的人,用的是您这套权重和计算量吗?

如果不是的话,这事跟您还有什么关系吗?

再者说了,今天您用60b一选否定了40b一选,明天呢?

你能否从真理的角度,来彻底否定不可能将来有个80b否定你这个60b的计算结果?

作者: 高粱米    时间: 2022-2-18 19:13
flyingsee 发表于 2022-2-18 18:43
然后呢?

您再次证明了柯洁的下法是“超越AI”——不过不是您这个AI,而是在当时观战时的人们所使用的 ...

现在的 AI 的技术路线就决定了, 它只能随着神经网络的训练和算力的堆砌而接近"围棋上帝"(假设我们有一个全知全能的围棋上帝). 您说的是对的, 以后有可能会有 80B 的权重的 AI 再来否定 60B 权重的 AI, 就看相关的 AI 技术玩家是不是有兴趣和资源去训练了.
您说得对, 用低端 AI 去做评判, 是不能言之凿凿的; 但是如果选点跑得全面一点, AI 配置高点, 计算量高点儿, 我还是更倾向于 AI 的判断.


非要追根究底的话, 一手棋到底好不好, 在没有"围棋上帝"来做裁决的情况之下, 只能"实战解决": 谁觉得行谁来, 谁牛谁说了算. AI 也有盲点, 但是不能据此说 AI 的评判就比人的判断不可靠, 不能因为人发现了一个 AI 的盲点就说 AI 不如人. 哪怕就柯洁那盘棋, 下完169手, 把伊凌涛换下来, 让野狐直播的 AI 上, 柯洁八成也是要输的; 当然了, 这也是没法验证的了.



作者: flyingsee    时间: 2022-2-18 19:17
高粱米 发表于 2022-2-18 19:13
现在的 AI 的技术路线就决定了, 它只能随着神经网络的训练和算力的堆砌而接近"围棋上帝"(假设我们有一个 ...

您可一定搞清楚,我们讨论的缘由,不是说用人下的去否定AI

谁也没说要否定AI

现在是有人用AI去否定人

而我们不同意后者,不同意后者不代表就要否定AI

作者: 高粱米    时间: 2022-2-18 19:30
flyingsee 发表于 2022-2-18 19:17
您可一定搞清楚,我们讨论的缘由,不是说用人下的去否定AI

谁也没说要否定AI

我们讨论的缘由不就是用 AI 去判断妙手是不是合适吗? 我的观点是, 以 AI 一选作为妙手唯一标准是不可取的; 但是AI 判断下的"错着"(我的错着的标准是胜率下降 20个点)应该不能判断为妙手, 哪怕因为人的因素, 使得这手棋取得了意想不到的结果, 那也只能视为"骗招".

当然, 因为技术的原因, 会导致 AI 的判断不是完全准确, 那么我们就应该更全面地来使用这个技术, 尽量减小这个不准确.

我对于用 AI 来判断古人的棋力也不置可否, 一方面不想争, 另一方面我认为古棋规则下的围棋和现在的围棋并不是一个游戏.

一个时代有一个时代的最强者, 但是围棋技术是发展的, 我们是"站在巨人肩膀上", 所以我们现在的职业选手比古人要强得多的. 但是我们没有理由鄙视他们. 打个比方吧, 现在很多大学生, 微积分比牛顿好得多, 但是他们是吸收了几百年以来的数学家的成就, 真要我说这些大学生比牛顿微积分强, 恐怕是没这个脸的.

作者: flyingsee    时间: 2022-2-18 19:36
本帖最后由 flyingsee 于 2022-2-18 19:39 编辑

说起“错招”,您说的我大部分都赞成。

问题是有些人就是在搞双标。

比如对这个图里的错招的平均值,视而不见






作者: 肥仔胡    时间: 2022-2-18 20:46
本帖最后由 肥仔胡 于 2022-2-18 20:49 编辑

高粱兄有所不知,不是说要打压古人,是因为古人身上附着动乱的寄生虫,为了揭穿寄生虫的丑态,不得已对古人有所误伤。附骨之蛆,不得不刮骨疗毒。其实我们都中了奸计。讨论个鸟棋力,这种鸟东西像鸡生蛋蛋生鸡一样没个鸟结论。所以两位不要争了,应该让那些把围棋游戏敌我斗争化的小丑,就后走盘面多9目判输棋的规则作出解释就够了。就是说请他们说说这种垃圾规则有个鸟合理性。
作者: 高粱米    时间: 2022-2-18 22:57
肥仔胡 发表于 2022-2-18 20:46
高粱兄有所不知,不是说要打压古人,是因为古人身上附着动乱的寄生虫,为了揭穿寄生虫的丑态,不得已对古人 ...

爱玩古棋的, 自己圈个地自己玩嘛, 互相眼不见为净就好了

作者: 闲云野鹤123    时间: 2022-2-18 23:12
本帖最后由 闲云野鹤123 于 2022-2-19 00:09 编辑
高粱米 发表于 2022-2-18 22:57
爱玩古棋的, 自己圈个地自己玩嘛, 互相眼不见为净就好了

ai不好用吗?跑跑谱等著你发掘奇思妙棋





欢迎光临 飞扬围棋 (http://flygo.net/Bbs/) Powered by Discuz! X3.2