用几个权重分析AZ的对战谱

hred9D · 发表于 2019-11-5 20:31

LZ为什么后半盘跟不上AZ?胜率还跳水？难道官子的算法不一样？

SmileFox · 发表于 2019-11-6 10:38

其实我觉得官子不怎么说明水平
尤其是大优局，怎么收都是赢，看法不同很正常

文武 · 发表于 2019-11-6 19:17

软件版为啥如此萧条

思无邪恒大 · 发表于 2019-11-7 14:55

强大！

nan · 发表于 2019-11-8 09:54

hred9D 发表于 2019-11-5 20:31
LZ为什么后半盘跟不上AZ?胜率还跳水？难道官子的算法不一样？

训练量以及分析用时都有差距导致的，毕竟AGZ是2小时的对局。

而且运算硬件4TPU起步，至少相当于两个16*2080ti的夜壶9D狗互咬。你想想

hred9D · 发表于 2019-11-8 15:58

本帖最后由 hred9D 于 2019-11-8 16:01 编辑

科学量化分析，看出了与AZ的差距。
最笨的单盘分析。拿最新的LZ分析AZ棋谱，中盘战中的选点，AZ的有的关键落点，在LZ中的前10个候选选点都没有出现过！
这是盲区了？
差距大，还是算法的问题？

nan · 发表于 2020-3-10 20:57

本帖最后由 nan 于 2020-3-10 23:35 编辑

分别使用
KataGo1.3.3 g170 40 block s1.35G
KataGo1.3.1 g170 20 block s1.91G
KataGo1.1 g104 20 block s0.44G
分析az自对弈第16谱（ELO 4925）

其中40B分析报告：
黑AI评分(吻合率): 77.2
黑差异手(前10): 233(14.7%), 245(12.2%), 227(9.0%), 225(8.8%), 137(-8.3%), 143(8.0%), 95(7.7%), 85(7.4%), 243(7.0%), 135(6.9%)
白AI评分(吻合率): 76.5
白差异手(前10): 242(20.5%), 164(19.4%), 248(13.2%), 144(12.0%), 142(-9.1%), 224(8.4%), 210(7.8%), 156(7.2%), 158(-6.8%), 134(6.5%)

结论：

最强的新权重已经完全解读对局：硬件设置2060gtx，20秒一步（400n/s*20=8000n，中低算力）
从40B分析获得的胜率波动看，不再如弱权重会大起大落或无脑抖动，不存在没有看到的盲点
官子部分十分精确，不再如弱权重会判断最后局面存在30%以上的胜率（leelaz257与minigoV17:14%）

因此KataGo40B目前在中低算力时超过AZ的4925elo水平是相当确定的。
如果考虑到大算力提升200elo的话，KataGo棋力达到5000-5100是合理推测。

PS：
考虑到KataGo在超高算力情况下屡屡中芈氏飞刀败北于LeelaZ，
以及神经网络测试KataGo40B处于LeelaZ245的水平（与LeelaZ相差20代权重）
KataGo的40B未来的成长值得期待！

nan · 发表于 2020-3-10 21:37

hred9D 发表于 2019-11-8 15:58
科学量化分析，看出了与AZ的差距。
最笨的单盘分析。拿最新的LZ分析AZ棋谱，中盘战中的选点，AZ的有的关键 ...

Game016目前KataGo无盲点。LeelaZ267也没问题。
但是Game020的很多点需要高算力，有些点是盲点。
原因在于训练量。现在LeelaZ刚到19M，KataGo谱量更少，大概10M以下。
AZ训练量接近30M

hred9D · 发表于 2020-3-13 13:17

本帖最后由 hred9D 于 2020-3-13 13:22 编辑

公布的最强的AZ训练棋谱是哪一局呢？谷歌是挑选后公布的。
是Extended Data Figure 6 - AlphaGo Zero 40 block vs AlphaGo Master中的
第Game_020.sgf局
AZ执黑胜阿尔法大师？

nan · 发表于 2020-4-1 15:10

hred9D 发表于 2020-3-13 13:17
公布的最强的AZ训练棋谱是哪一局呢？谷歌是挑选后公布的。
是Extended Data Figure 6 - AlphaGo Zero 40 b ...

你是说比赛谱吧，局时2小时。

我认为应该是AGZ两小时自我对战的第20局[链接：Game020] 论文"Extended Data Figure 4"部分。
毕竟AGZ对战自己的胜率（执白）才60%左右，而对战AG-master胜率到了89%。

AGZ对战AG-master的棋型有个基本布局，2、8、10、14、16、18、20的前50手一致性非常高。
可以说master对那个二间高夹认识不够，总是吃亏。之所以认识不够是因为往前回溯，布局认识落后于zero，点三三玩的不够深。
zero玩到腻，征子认识清楚，角部定式已经改飞挂或者护角了。真正能让zero放招的只有zero（个人观点）。

nan · 发表于 2020-4-1 15:11

下面说说我对这一谱(AGZ-Game020)的看点：

第150手，二路妙手简直吴清源附体！这一谱我最喜欢这一招。
这个盲点目前只有katago(40B-s238)有机会下出。
katago（40B-s238）的神经网络权重和katago（40B-s192）和LZ270一样，L18只有0.5的policy。
但是只有katago（40B-s238）把L18放入了前8的计算选点，超高计算量可以下出。

第159手，20b权重（minigo、elfV2、轰烈20b-lz）在50万以上的计算量可以下出。
但是直到LZ249之后，40B权重才能用类似计算量算出，否则需要成倍的计算量，非常难。
接下来的第160手LZ270还搞不清楚提掉还是切断，Katago已经非常明确的切断了，单看这一招，是katago强。

但是单从几个、或者数十个盲点看权重能力，不能得出确定可靠的结论，权当自娱自乐了。
首位计算量50万每步，katago40b-s192和LZ270已经能够解释Game019，只存在148/154/161/184/185这5个盲点（katago40B-s238有改善）。
目前katago已经有了自己的评分系统，在阿尔法狗的迷雾里面，也就是这些2小时对战谱比较有价值，数量太少，只能做局面评估测试用。

我感觉katago高计算量已经到了ELO5125 - 5185之间，LZ270在ELO4900 - 5000之间，低于katago200分。
如果低估一档，katago到ELO5025-5125之间，完全没有问题，至少在解读Game019上KataGo40B-s192给出了高吻合率高评分（黑90%:84分，白85%:77分），Game018上给出了高吻合率和低评分（黑79.5%:70.7分，白81.1%:71.9分），选点条件：前3选点且计算量5%以上。

现在看，katago已经建立了棋力评估体系，以前未知阿尔法狗的棋力，现在已经接近完全了解了，我会用最新40B-s238权重再次复盘Game016-Game020，做最后一个更新。

lxjtt09 · 发表于 2020-4-1 15:34

本帖最后由 lxjtt09 于 2020-4-1 15:48 编辑

楼主分析非常好，已收藏。感觉katago中后盘比leela精准。不过里拉270也很强了，对卡塔狗30b布局经常占优，中盘初期不落下风，偶尔能完胜一盘。当然更多的是中盘中后期无法抵挡katago的精准计算被击溃。

天行者 · 发表于 2020-4-1 17:13

nan 发表于 2020-4-1 15:11
下面说说我对这一谱(AGZ-Game020)的看点：

第150手，二路妙手简直吴清源附体！这一谱我最喜欢这一招。

想法不错，有些意义！只可惜楼主的配置不太高，如果能用高配置的机器跑跑估计效果会更好！
你说的150像吴清源附体，太过了，这个大概业余棋手也能算出来。
后面好像黑棋在退让，261断是成立的，居然没看到。。。
能挑出双方的错误，说明katago现在的实力应该不弱于阿尔法Zero！本来阿尔法Zero研究方向就是正确的，如果不能超越就说明老师指引的方向有错误。超越只是时间的问题。。。

吻合率很高啊。。。

天行者 · 发表于 2020-4-1 17:20

nan 发表于 2020-3-10 20:57
分别使用
KataGo1.3.3 g170 40 block s1.35G
KataGo1.3.1 g170 20 block s1.91G

现在的katago已经升级到1.35版本，针对芈式飞刀也做了策略性针对，不存在中刀的问题了！赶快升级吧！

hred9D · 发表于 2020-4-5 09:55

nan 发表于 2020-4-1 15:10
你是说比赛谱吧，局时2小时。

我认为应该是AGZ两小时自我对战的第20局[链接：Game020] 论文"Extended ...

你是对的，应该是这一局。仔细看了谷歌的说明书

【Extended Data Figure 5 - AlphaGo Zero 40 block self-play games】
这是40 block在40天内的自学历程
精选AlphaGo Zero少年期不需要人类知识，40b从18K开始自我强化学习，互搏的20局供人类参考。AlphaGo Zero经过大约40天2900万场自玩游戏的训练后，以 89 ：11 的比分击败了AlphaGo Master（AlphaGo2.0版本），AlphaGo Master在2017年5月乌镇AI峰会上击败了围棋世界冠军柯洁。

【Extended Data Figure 6 - AlphaGo Zero 40 block vs AlphaGo Master】
40b的AlphaGo Zero已经没有人类对手，因为AlphaGo Master在2017年5月乌镇AI围棋峰会上击败了围棋世界冠军柯洁。东方不败AlphaGo Master，惨败于40b的AlphaGo Zero。
这是40 block训练40天的AlphaGo Zero对AlphaGo Master版本的对弈。
精选AlphaGo Zero青年期对AlphaGo Master，AlphaGo Zero优胜20局（胜率 89 ：11比分）供人类参考。

帐号		自动登录	找回密码
密码			注册

用几个权重分析AZ的对战谱

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源