飞扬围棋论坛

 找回密码
 注册
搜索
查看: 10536|回复: 7
打印 上一主题 下一主题

细品《江湖视野:古今围棋名家棋力榜》——AI评估棋谱渐入佳境

[复制链接]
跳转到指定楼层
1#
发表于 2021-9-23 16:38 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
细品《江湖视野:古今围棋名家棋力榜》

——AI评估棋谱渐入佳境



作者:时年



近一个月,笔者先后读到两篇份量颇重的文章——《“名人”还是“业5”?从“围棋AI分析”看中国清代围棋水平》和《江湖视野:古今围棋名家棋力榜》,为之拍案称绝。前者是职业棋手崔灿所著,后者是江湖隐士所作,内容丰富,数据翔实,耳目一新,可谓是AI分析棋谱这一全新领域的一对珠壁。记得我刚读崔灿论文时,连续读了三遍,才大致看明白。这次也一样,《棋力榜》我也是连续看了三遍,才大致看明白。这两篇文章论述了使用围棋AI分析评价棋谱的研究方法和研究成果,自成体系,互相联系,却又互不影响。



崔灿论文的结论是这样写的:

1.以KataGo 1.5.0 20B权重,1000K计算量下的围棋AI“吻合度”等指标来衡量棋局前180手,“黄范施”三人代表的中国清代围棋水平,与当代围棋职业高手的差异不具有显著性。

2.以KataGo 1.5.0 20B权重,1000K计算量下的围棋AI“吻合度”等指标来衡量棋局前180手,“黄范施”三人代表的中国清代围棋水平,领先于以道策为代表的日本江户前期围棋水平,与丈和、秀策为代表的江户后期日本围棋水平差异不具有显著性。

3.“黄范施”三人代表的清代围棋中盘水平,与当代职业顶尖棋手及日本江户时代顶尖棋手的差异不具有显著性。清代围棋布局的水平确实与当代棋手存在差距,但与日本古棋的布局水平至少在伯仲之间。

当我读到“差异不具有显著性”时,很佩服崔灿实事求是的态度,科学研究就应该用词准确。我当时在想:水平接近,到底相差多少呢?当时的心情有点小遗憾,如果能有一个量化的评估体系就好了。



《江湖视野:古今围棋名家棋力榜》出来后,我的那点小遗憾没有了——终于有棋友提出了一种AI评估棋力的量化方法。当然,这种量化评估方法能否成立,还需要时间检验。此文最后写道:

本文的目的主要在于探讨AI评价棋力的方法,由于本文工作采用的是少量数据,结果仅供参考。本人实在受限于资源,不能大量研究。更多的是希望抛砖引玉,希望广大棋友能够提供更多是数据,更详实的资料,更科学合理的方法、策略和规范,届时能够得到更加客观的结论。科学研究崇尚置疑,哪怕和本文结论有所不同,也是好事。本文的另一个目的是探讨棋艺本质。AI出现以来,反思过去,似乎人类围棋走了一段弯路。厘清棋艺本质,消除认知误区,这不仅是职业棋手的追求,也是棋迷朋友的追求。追求围棋认知更高,行棋调更快,掌控能力更强。AI数据已经反复证明了中国古棋的强大,这是科学,这是事实。承认中国古棋的强大,才能虚心的向前辈棋手学习,汲取营养,站在巨人的肩膀之上。

我读懂了,此文的主要目的有二,一是提出一种AI评价棋力的方法,二是探讨棋艺本质,向人类棋力巅峰前辈学习。此文作者乃江湖隐士,深知资源匮乏,特地说明《棋力榜》的结果仅供参考。有棋友置疑江湖隐士的计算量低,只有10K。换个角度思考问题,以江湖隐士很有限的资源、时间、精力去做,得做到猴年马月了。所以,我以为,《棋力榜》一文,最有价值的部分是研究方法,眼下,我们只要关注研究方法是否科学就行了。至于《棋力榜》排名,只是研究方法衍生出来的结论,不必纠结。



那么,两篇文章,两种方法,两个体系,哪一个更好呢?这个问题细究起来很费事,就好象在问牛顿力学和相对论,哪种方法更好?牛顿和爱因斯坦,在物理学上的地位一样重要,具体应用得看实际需要。所以,我觉得,如果只是想大致判断棋力水平,得出“差异不具有显著性”这样的结论,用崔灿的方法比较好,方便快捷。如果想比较准确评估棋谱棋力水平,用《棋力榜》的方法比较合适,难度略大。



下面谈谈我对《江湖视野:古今围棋名家棋力榜》一文的观后感,只谈此文的方法体系,有三点需要我们注意。



一、吻合度是评估主要指标,需要修正

1、此文提出“胜率单向波动”概念,认为应该剔除与胜负无关的布局手数和官子手数。统计手数从(布局)从胜率较大波动开始,在胜负已经分明的前提下,官子手数也要剔除。这样做的优点是,排除了布局定式、布局套路、简单官子的必然下法造成的吻合度虚高。

2、吻合度全部使用一选吻合度。理由是高强度对抗局面下,失之毫厘,谬以千里。

3、不仅仅看平均吻合度,还要兼顾最低吻合度和最高吻合度。

二、不确定度(复杂度)作为次要指标

此文提出“掌控复杂度”概念,或者叫“复杂度上限”,即一个棋手在战斗局面中能够保持较高吻合度时,不确定度(复杂度)的上限,一旦超过这个上限,棋手的吻合度大幅下降。如果某棋手的棋谱吻合度都很高,却找不到一盘不确定度(复杂度)高的棋来证明其战斗力强大,那么对其棋力评估不完整。

三、此文研究方法通过了AI不同权重的检测

此文给出katago6b,10b,15b,20b,30b,40b的分析结果。使用的指标有全局吻合度,波动区间吻合度和复杂度。可以看到全局吻合度和区间吻合度都有较好的区分度,复杂度指标区分不明显。此文认为,高复杂度对局可遇而不可求,样本太少。



此文是中秋节晚上在弈客围棋上发表的,似乎是很赶时间,有些内容意犹未尽。考虑江湖人诸多艰难条件,此文能写成这样,已经难能可贵,不再苛求。此文作者希望此文抛砖引玉,期待更多的能者达人加入进来,我以为是作者的心里话。



以上是细品《江湖视野:古今围棋名家棋力榜》一文的粗浅体会,不对之处,还请指正。



本想就此结束,忽然遥想到一百年前,物理学的天空群星闪烁,除了爱因斯坦,还有普朗克、玻尔、海森堡,狄拉克,薛定谔等科学巨匠,他们共同努力,解决了经典物理学的“两朵乌云”,成功打造出现代物理学的框架体系。今天的科学无论怎么细化发展,都没有跑出科学巨匠创造的理论范围。围棋是小众,使用AI分析棋谱更是小众中的小众,但是,谁能解决这个问题,其意义不亚于AlphaGo横空出世。因为,谁都知道人工智能必将战胜人类围棋,只是时间早晚的事。而关公战秦琼,却是纠结围棋界多年来的一桩谜案。



崔灿完成了使用AI评估棋谱的开创性工作,《棋力榜》作者完成了使用AI评估棋谱的量化性工作,接下来,谁会是这一全新领域中的普朗克、玻尔、海森堡,狄拉克和薛定谔呢?我们拭目以待。



《左传·襄公二十四年》:“太上有立德,其次有立功,其次有立言,虽久不废,此之谓三不朽。”
回复

使用道具 举报

2#
发表于 2021-9-23 16:50 | 只看该作者
占个位子先
回复 支持 反对

使用道具 举报

头像被屏蔽
3#
发表于 2021-9-23 18:11 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

4#
发表于 2021-9-23 18:34 | 只看该作者

阿狗站在围棋顶峰,一览AI众山小,ai各路豪強百花绽放,指导著人类围棋思路
回复 支持 反对

使用道具 举报

5#
发表于 2021-9-24 09:24 | 只看该作者
关于高吻合度,象棋上可以借签:
1、象一些象棋布局,在AI出现之前,经过反复研究,已经得出了官着,如果双方走官着,模仿前人的下法,那吻合度是很高的;
2、在新布局下,双方犯错的概率极高。以“三三天元”的吴——秀哉名局,草创新布局的吴和第一次应付新布局的秀哉,在布局上都犯了大量错误。何以?因为没有前人的研究,完全靠自身棋力的分析和积累;
3、晚清的布局号称千篇一律,与前贤的差距,就在于布局的变化。从周懒予双压应双飞始,到范施,双飞燕趋于定型,吻合度一直在提高,离不开周到范施的各代超一流棋手的不断更新完善;
4、象棋中,桔梅二谱中盘基本有定式,天地炮、马后炮、双马饮泉、钓鱼马,相类似,围棋在序盘定式化后延伸到中盘定式化,在古棋桃花泉中五六飞攻、九三镇头等都是中盘定式;
5、象棋残棋有例胜、例和,基本定式化,围棋官子定型是最早定式化的,在无时间限制的情况下,秀或时代的官子跟坂田-林时代官子,明显秀哉时代的吻合度高。
回复 支持 反对

使用道具 举报

6#
发表于 2021-9-24 12:18 | 只看该作者
闲的
回复 支持 反对

使用道具 举报

7#
发表于 2021-9-24 13:08 | 只看该作者
两篇都看过,确实好文!也许统计还不够完善,论据还不够客观充实,就此下结论为时尚早,但至少是实实在在下功夫在做事,真正投入时间精力在研究,仅此就已经比那些自以为是想当然的要强上一万倍。期待后续研究成果
回复 支持 反对

使用道具 举报

头像被屏蔽
8#
发表于 2021-9-24 15:48 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2024-5-8 00:49 , Processed in 0.169161 second(s), 18 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表