细品《江湖视野：古今围棋名家棋力榜》——AI评估棋谱渐入佳境

三国大军师 · 发表于 2021-9-23 16:38

细品《江湖视野：古今围棋名家棋力榜》

——AI评估棋谱渐入佳境

作者：时年

近一个月，笔者先后读到两篇份量颇重的文章——《“名人”还是“业5”？从“围棋AI分析”看中国清代围棋水平》和《江湖视野：古今围棋名家棋力榜》，为之拍案称绝。前者是职业棋手崔灿所著，后者是江湖隐士所作，内容丰富，数据翔实，耳目一新，可谓是AI分析棋谱这一全新领域的一对珠壁。记得我刚读崔灿论文时，连续读了三遍，才大致看明白。这次也一样，《棋力榜》我也是连续看了三遍，才大致看明白。这两篇文章论述了使用围棋AI分析评价棋谱的研究方法和研究成果，自成体系，互相联系，却又互不影响。

崔灿论文的结论是这样写的：

1.以KataGo 1.5.0 20B权重，1000K计算量下的围棋AI“吻合度”等指标来衡量棋局前180手，“黄范施”三人代表的中国清代围棋水平，与当代围棋职业高手的差异不具有显著性。

2.以KataGo 1.5.0 20B权重，1000K计算量下的围棋AI“吻合度”等指标来衡量棋局前180手，“黄范施”三人代表的中国清代围棋水平，领先于以道策为代表的日本江户前期围棋水平，与丈和、秀策为代表的江户后期日本围棋水平差异不具有显著性。

3.“黄范施”三人代表的清代围棋中盘水平，与当代职业顶尖棋手及日本江户时代顶尖棋手的差异不具有显著性。清代围棋布局的水平确实与当代棋手存在差距，但与日本古棋的布局水平至少在伯仲之间。

当我读到“差异不具有显著性”时，很佩服崔灿实事求是的态度，科学研究就应该用词准确。我当时在想：水平接近，到底相差多少呢？当时的心情有点小遗憾，如果能有一个量化的评估体系就好了。

《江湖视野：古今围棋名家棋力榜》出来后，我的那点小遗憾没有了——终于有棋友提出了一种AI评估棋力的量化方法。当然，这种量化评估方法能否成立，还需要时间检验。此文最后写道：

本文的目的主要在于探讨AI评价棋力的方法，由于本文工作采用的是少量数据，结果仅供参考。本人实在受限于资源，不能大量研究。更多的是希望抛砖引玉，希望广大棋友能够提供更多是数据，更详实的资料，更科学合理的方法、策略和规范，届时能够得到更加客观的结论。科学研究崇尚置疑，哪怕和本文结论有所不同，也是好事。本文的另一个目的是探讨棋艺本质。AI出现以来，反思过去，似乎人类围棋走了一段弯路。厘清棋艺本质，消除认知误区，这不仅是职业棋手的追求，也是棋迷朋友的追求。追求围棋认知更高，行棋调更快，掌控能力更强。AI数据已经反复证明了中国古棋的强大，这是科学，这是事实。承认中国古棋的强大，才能虚心的向前辈棋手学习，汲取营养，站在巨人的肩膀之上。

我读懂了，此文的主要目的有二，一是提出一种AI评价棋力的方法，二是探讨棋艺本质，向人类棋力巅峰前辈学习。此文作者乃江湖隐士，深知资源匮乏，特地说明《棋力榜》的结果仅供参考。有棋友置疑江湖隐士的计算量低，只有10K。换个角度思考问题，以江湖隐士很有限的资源、时间、精力去做，得做到猴年马月了。所以，我以为，《棋力榜》一文，最有价值的部分是研究方法，眼下，我们只要关注研究方法是否科学就行了。至于《棋力榜》排名，只是研究方法衍生出来的结论，不必纠结。

那么，两篇文章，两种方法，两个体系，哪一个更好呢？这个问题细究起来很费事，就好象在问牛顿力学和相对论，哪种方法更好？牛顿和爱因斯坦，在物理学上的地位一样重要，具体应用得看实际需要。所以，我觉得，如果只是想大致判断棋力水平，得出“差异不具有显著性”这样的结论，用崔灿的方法比较好，方便快捷。如果想比较准确评估棋谱棋力水平，用《棋力榜》的方法比较合适，难度略大。

下面谈谈我对《江湖视野：古今围棋名家棋力榜》一文的观后感，只谈此文的方法体系，有三点需要我们注意。

一、吻合度是评估主要指标，需要修正

1、此文提出“胜率单向波动”概念，认为应该剔除与胜负无关的布局手数和官子手数。统计手数从（布局）从胜率较大波动开始，在胜负已经分明的前提下，官子手数也要剔除。这样做的优点是，排除了布局定式、布局套路、简单官子的必然下法造成的吻合度虚高。

2、吻合度全部使用一选吻合度。理由是高强度对抗局面下，失之毫厘，谬以千里。

3、不仅仅看平均吻合度，还要兼顾最低吻合度和最高吻合度。

二、不确定度（复杂度）作为次要指标

此文提出“掌控复杂度”概念，或者叫“复杂度上限”，即一个棋手在战斗局面中能够保持较高吻合度时，不确定度（复杂度）的上限，一旦超过这个上限，棋手的吻合度大幅下降。如果某棋手的棋谱吻合度都很高，却找不到一盘不确定度（复杂度）高的棋来证明其战斗力强大，那么对其棋力评估不完整。

三、此文研究方法通过了AI不同权重的检测

此文给出katago6b，10b，15b，20b，30b，40b的分析结果。使用的指标有全局吻合度，波动区间吻合度和复杂度。可以看到全局吻合度和区间吻合度都有较好的区分度，复杂度指标区分不明显。此文认为，高复杂度对局可遇而不可求，样本太少。

此文是中秋节晚上在弈客围棋上发表的，似乎是很赶时间，有些内容意犹未尽。考虑江湖人诸多艰难条件，此文能写成这样，已经难能可贵，不再苛求。此文作者希望此文抛砖引玉，期待更多的能者达人加入进来，我以为是作者的心里话。

以上是细品《江湖视野：古今围棋名家棋力榜》一文的粗浅体会，不对之处，还请指正。

本想就此结束，忽然遥想到一百年前，物理学的天空群星闪烁，除了爱因斯坦，还有普朗克、玻尔、海森堡，狄拉克，薛定谔等科学巨匠，他们共同努力，解决了经典物理学的“两朵乌云”，成功打造出现代物理学的框架体系。今天的科学无论怎么细化发展，都没有跑出科学巨匠创造的理论范围。围棋是小众，使用AI分析棋谱更是小众中的小众，但是，谁能解决这个问题，其意义不亚于AlphaGo横空出世。因为，谁都知道人工智能必将战胜人类围棋，只是时间早晚的事。而关公战秦琼，却是纠结围棋界多年来的一桩谜案。

崔灿完成了使用AI评估棋谱的开创性工作，《棋力榜》作者完成了使用AI评估棋谱的量化性工作，接下来，谁会是这一全新领域中的普朗克、玻尔、海森堡，狄拉克和薛定谔呢？我们拭目以待。

《左传·襄公二十四年》：“太上有立德，其次有立功，其次有立言，虽久不废，此之谓三不朽。”

飞天棋神 · 发表于 2021-9-23 16:50

占个位子先

lanke2021 · 发表于 2021-9-23 18:11

提示: 作者被禁止或删除内容自动屏蔽

闲云野鹤123 · 发表于 2021-9-23 18:34

lanke2021 发表于 2021-9-23 18:11
X客的免费劳工。

阿狗站在围棋顶峰，一览AI众山小，ai各路豪強百花绽放，指导著人类围棋思路

jzhang · 发表于 2021-9-24 09:24

关于高吻合度，象棋上可以借签：
1、象一些象棋布局，在AI出现之前，经过反复研究，已经得出了官着，如果双方走官着，模仿前人的下法，那吻合度是很高的；
2、在新布局下，双方犯错的概率极高。以“三三天元”的吴——秀哉名局，草创新布局的吴和第一次应付新布局的秀哉，在布局上都犯了大量错误。何以？因为没有前人的研究，完全靠自身棋力的分析和积累；
3、晚清的布局号称千篇一律，与前贤的差距，就在于布局的变化。从周懒予双压应双飞始，到范施，双飞燕趋于定型，吻合度一直在提高，离不开周到范施的各代超一流棋手的不断更新完善；
4、象棋中，桔梅二谱中盘基本有定式，天地炮、马后炮、双马饮泉、钓鱼马，相类似，围棋在序盘定式化后延伸到中盘定式化，在古棋桃花泉中五六飞攻、九三镇头等都是中盘定式；
5、象棋残棋有例胜、例和，基本定式化，围棋官子定型是最早定式化的，在无时间限制的情况下，秀或时代的官子跟坂田-林时代官子，明显秀哉时代的吻合度高。

新湖山人 · 发表于 2021-9-24 12:18

闲的

修业之道 · 发表于 2021-9-24 13:08

两篇都看过，确实好文！也许统计还不够完善，论据还不够客观充实，就此下结论为时尚早，但至少是实实在在下功夫在做事，真正投入时间精力在研究，仅此就已经比那些自以为是想当然的要强上一万倍。期待后续研究成果

lanke2021 · 发表于 2021-9-24 15:48

提示: 作者被禁止或删除内容自动屏蔽

帐号		自动登录	找回密码
密码			注册

lanke2021 lanke2021 当前离线积分 2232 头像被屏蔽	3^# 发表于 2021-9-23 18:11 来自手机 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
lanke2021 lanke2021 当前离线积分 2232 头像被屏蔽
	回复支持反对使用道具举报

lanke2021 lanke2021 当前离线积分 2232 头像被屏蔽	8^# 发表于 2021-9-24 15:48 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
lanke2021 lanke2021 当前离线积分 2232 头像被屏蔽
	回复支持反对使用道具举报