飞扬围棋

标题: 从“棋局掌控力”看，清代黄施范与当代业余高手不存在显著差别 [打印本页]

作者: flyingsee 时间: 2022-1-23 15:05
标题: 从“棋局掌控力”看，清代黄施范与当代业余高手不存在显著差别
数据和“棋局掌控力”定义来自 https://zhuanlan.zhihu.com/p/401014051清代围棋顶尖国手“掌控力”分析

作为评价指标，围棋AI吻合度无法对“不吻合”着法的优劣程度进行区别，是其一大缺陷。“AI评分”在一定程度上弥补了这一点，但给出的评价仍然受到围棋AI计算量偏好的影响。上一章提到的反对使用围棋AI评价人类棋手水平，认为“棋手更应该选择自己能够理解、掌控的下法”这种观点，其潜台词是“围棋AI的标准太高，人类棋手熟悉的下法也亏不了多少”。因此，借鉴之前研究中的围棋AI指标提炼方法，在“胜率”方面设立一些不同的标准，以考察清代围棋国手的“棋局掌控力”——在一局棋中保持稳定发挥，尽量减少“恶手”的数量与严重程度。

(1)不同胜率损失标准下的“吻合度”

设立一系列的“掉胜率”标准，考察棋手着法与围棋AI推荐的选点相比，能将胜率损失控制在多大的范围内。具体标准设置为胜率损失2%、5%、10%和20%以下，结果见下表。

【原文论文结论：】仅仅将胜率标准放宽两个百分点，各组别棋手的AI评价均大幅提升。“江户后期”组的两位棋手又一次体现了“稳定性”，各标准下的数值均与当代职业高手相似。清代顶尖国手在这方面表现稍有逊色，但也与另外两组数据接近。

【真正的结论：清代顶尖国手在这方面的表现，除第一栏外，与“当代业余高手”（以及“道策”）没有显著差别，与“丈和&秀策”和当代职业高手差距明显。】

(2)“大恶手”的损失程度

统计一局棋中，掉胜率最多的着法“TOP10”，并按照不同标准，计算其“最恶N手”所降胜率的平均值。结果见下表。

【原论文结论：】“江户后期”组的恶手胜率亏损值，甚至低于当代顶尖棋手平均水平，不得不再次感叹秀策的稳定性。当然，胜率类指标参考更受棋手风格影响，考虑到“当湖十局”的激烈程度，清代顶尖国手能有这样的表现也算不错了。

【真正的结论：清代顶尖国手在这方面的表现，除了第一栏外，其他均与“当代业余高手”没有显著差别；与“丈和&秀策”和当代职业高手差距明显，各项指标都比道策还差一些。】

作者: 闲云野鹤123 时间: 2022-1-23 18:51
本帖最后由闲云野鹤123 于 2022-1-23 23:53 编辑

今棋与古棋规则不同,两者不可一概而论

作者: 肥仔胡 时间: 2022-1-23 20:35
当湖十局激烈，日本的各门派之争更是性命相博，大平修三先生说，日本古棋的计算力要比现代深远，见《名局鉴赏室》。四大门派的争夺，关系到棋界话语权，俸禄，棋手生活，实际上不能以当湖十局的激烈作为古棋不稳定的借口，哪个棋不激烈。日本围棋铺地板的传说，和高部是日本六超一样不靠谱，对于历史的分析，谁占有更多的资料，谁更有发言权。

作者: 闲云野鹤123 时间: 2022-1-23 22:49

肥仔胡发表于 2022-1-23 20:35
当湖十局激烈，日本的各门派之争更是性命相博，大平修三先生说，日本古棋的计算力要比现代深远，见《名局鉴 ...

仅就才能而言,范原本就是古今第一,毋庸置疑

作者: 肥仔胡 时间: 2022-1-24 04:40
本帖最后由肥仔胡于 2022-1-24 04:52 编辑

闲云野鹤123 发表于 2022-1-23 22:49
仅就才能而言,范原本就是古今第一,毋庸置疑

我认为闲云野鹤兄这句话相对靠谱，中国人的围棋天赋肯定比日本人高一点。只是规则压制了天赋，压制了棋的水平。当然范圣的才能是不是古今第一有待商榷，毕竟吴老，柯洁比范圣更加早熟，而且巅峰期更加强悍（即便没有ai，我也这么认为）。在吴老眼中，中古的代表人物是黄月天和施定庵，没有范圣。张大勇老师曾经把吴清源列为古今第一。崇古的陈老在排古今力棋时，显然在坂田先生这多费了不少笔墨。所以……

作者: jianglei 时间: 2022-1-24 08:41
我以前看到一个说法（不当真），范施据说有13局，施前面不如范，后面赶上了，或有超越的趋势（就在这13局中超越了估计胜多负少）
但当时范的粉丝更多，天赋满满，所以裁剪为10局，
无论如何，他们两个包括更早的黄龙士也的确是中国古代围棋技艺的巅峰！其中的艺术性是经过吴陈罗程等前辈职业棋手鉴定出书的。
当然，有些三逼汽油，非要说座子棋牛座子棋正座子棋伟，就不在棋艺的讨论中了

作者: jianglei 时间: 2022-1-24 08:50
对古人先哲，我是尊敬的，但不是盲目崇拜的--鲁迅和吴清源如是说
但就我个人来说，不说全局大局观，如围棋十决，这些高可以上哲学高度，低就纯粹是嘴炮。
就拿死活题而言，玄玄和官子谱虽然难度不如古代日本不断樱和现代韩国的天龙图，但比秀哉的死活妙机不差吧，论其中的艺术性，完全不遑多让天龙图这种硬巴巴的计算吧。

作者: 肥仔胡 时间: 2022-1-30 09:16
顶。

作者: flyingsee 时间: 2022-1-30 14:49
挑出来一些被AI肯定的个别招法有什么普遍性意义？

还是得看统计数据，看其表现出来的一般规律。

作者: flyingsee 时间: 2022-6-6 00:54
重要的结论顶上来

作者: flyingsee 时间: 2022-6-10 19:09
这个结论至今没有被驳倒

有些无知无畏的妄人视而不见

作者: 肥仔胡 时间: 2022-6-11 19:27
这个帖子是我进入论坛以来，看到的最精华的帖子。

作者: forjoke21cn 时间: 2022-6-12 19:14
不考虑复杂度单纯比较吻合度，如同只比较待在马背上的时间，而不考虑温顺母马和顽劣野马的差别。复杂度到50的时候，katago自己的一选都产生很大的波动

作者: flyingsee 时间: 2022-6-12 23:34
本帖最后由 flyingsee 于 2022-6-12 23:42 编辑

forjoke21cn 发表于 2022-6-12 19:14
不考虑复杂度单纯比较吻合度，如同只比较待在马背上的时间，而不考虑温顺母马和顽劣野马的差别。复杂度到50 ...

（七）“复杂度/不确定度”

在一手棋的“目差”之外，KataGo还统计了计算过程中所有变化[23]的目差，并根据计算量进行加权求和，得到当前局面的“目差标准差（scoreStdDev）”。Yzy在Lizzie中提取了这一指标，起初将其命名为“复杂度”，后因感觉表述不够准确，可能引起误解，遂更改为“不确定度”。

不过，一些棋友认为该指标可以结合“吻合度”，成为评价棋手水平的试金石。理由是倘若一个局面的“目差标准差”数值高，意味着围棋AI计算的变化出现了较大分歧，即“AI算不准”，这说明此时局面十分复杂。在局面复杂时吻合度高，要比局势平稳时的“吻合”更体现水平。

上述说法在“效度”方面的逻辑似乎没问题，但未提及该指标“信度”方面的表现。对这一指标的考察测试，主要得出以下几点结论：

1.根据该指标计算原理，在不同的计算量下，其数值会存在明显差异。围棋AI权重不同也会影响该指标数值。因此，“复杂度/不确定度”怎样才算“高”，缺乏明确的标准。

2.该指标会受到局面优势大小的影响，与当前局面“目差”的数值成正相关。

3.该指标数值“高”时，会放大围棋AI“随机性”的影响，导致取样方面的困难。

除了以上缺点之外，以“复杂度/不确定度”结合吻合度判定棋手水平，在逻辑方面存在硬伤——既然围棋AI都算不准了，那么此时的“吻合度”显然失去了优劣评价的意义。综上所述，“目差标准差”可以看作是围棋AI眼中棋盘上的变数，在一定程度上展现了棋局的风格，但“棋风”无法直接与水平挂钩。KataGo的作者David J. Wu在被问及这一指标的意义时，也表达了同样的观点。

除此以外，棋局的“不确定度”高，不代表棋手驾驭复杂局面的能力就高。

“不确定度”是AI算出来，不是棋手驾驭出来的。最后牛逼的是AI，不是棋手本身。

把局面搅乱，搞的很复杂，不代表棋手下这个局面的棋力就高、能力就强。

如果连这个简单的逻辑关系都不懂，就最好不要妄谈什么复杂度。

作者: golch 时间: 2023-8-22 15:01
都不是一个规则，怎么比？推倒胡和血战到底一起比赛？

作者: flyingsee 时间: 2023-8-22 16:56

golch 发表于 2023-8-22 15:01
都不是一个规则，怎么比？推倒胡和血战到底一起比赛？

前边的那些评测是按照古棋规则评测的。已经考虑了规则上的细微不同。
所谓规则不同不能比较，纯粹是一种借口。

欢迎光临飞扬围棋 (http://flygo.net/bbs/)