飞扬围棋论坛

 找回密码
 注册
搜索
楼主: nan
打印 上一主题 下一主题

用几个权重分析AZ的对战谱

[复制链接]
16#
发表于 2019-11-5 20:31 | 只看该作者
LZ为什么后半盘 跟不上AZ?胜率还跳水?难道官子的算法不一样?
回复 支持 反对

使用道具 举报

17#
发表于 2019-11-6 10:38 | 只看该作者
其实我觉得官子不怎么说明水平
尤其是大优局,怎么收都是赢,看法不同很正常
回复 支持 反对

使用道具 举报

18#
发表于 2019-11-6 19:17 | 只看该作者
软件版为啥如此萧条
回复 支持 反对

使用道具 举报

19#
发表于 2019-11-7 14:55 | 只看该作者
强大!
回复 支持 反对

使用道具 举报

20#
 楼主| 发表于 2019-11-8 09:54 | 只看该作者
hred9D 发表于 2019-11-5 20:31
LZ为什么后半盘 跟不上AZ?胜率还跳水?难道官子的算法不一样?

训练量以及分析用时都有差距导致的,毕竟AGZ是2小时的对局。

而且运算硬件4TPU起步,至少相当于两个16*2080ti的夜壶9D狗互咬。你想想

回复 支持 反对

使用道具 举报

21#
发表于 2019-11-8 15:58 | 只看该作者
本帖最后由 hred9D 于 2019-11-8 16:01 编辑

科学量化分析,看出了与AZ的差距。
最笨的单盘分析。拿最新的LZ分析AZ棋谱,中盘战中的选点,AZ的有的关键落点,在LZ中的前10个候选选点都没有出现过!
这是盲区了?
差距大,还是算法的问题?
回复 支持 反对

使用道具 举报

22#
 楼主| 发表于 2020-3-10 20:57 | 只看该作者
本帖最后由 nan 于 2020-3-10 23:35 编辑


分别使用
KataGo1.3.3 g170 40 block s1.35G
KataGo1.3.1 g170 20 block s1.91G
KataGo1.1    g104 20 block s0.44G
分析az自对弈第16谱(ELO 4925)

其中40B分析报告:
黑AI评分(吻合率): 77.2
黑差异手(前10):  233(14.7%), 245(12.2%), 227(9.0%), 225(8.8%), 137(-8.3%), 143(8.0%), 95(7.7%), 85(7.4%), 243(7.0%), 135(6.9%)
白AI评分(吻合率): 76.5
白差异手(前10): 242(20.5%), 164(19.4%), 248(13.2%), 144(12.0%), 142(-9.1%), 224(8.4%), 210(7.8%), 156(7.2%), 158(-6.8%), 134(6.5%)


结论:

最强的新权重已经完全解读对局:硬件设置2060gtx,20秒一步(400n/s*20=8000n,中低算力)
从40B分析获得的胜率波动看,不再如弱权重会大起大落或无脑抖动,不存在没有看到的盲点
官子部分十分精确,不再如弱权重会判断最后局面存在30%以上的胜率(leelaz257与minigoV17:14%)

因此KataGo40B目前在中低算力时超过AZ的4925elo水平是相当确定的。
如果考虑到大算力提升200elo的话,KataGo棋力达到5000-5100是合理推测。

PS:
考虑到KataGo在超高算力情况下屡屡中芈氏飞刀败北于LeelaZ,
以及神经网络测试KataGo40B处于LeelaZ245的水平(与LeelaZ相差20代权重)
KataGo的40B未来的成长值得期待!



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 1 反对 0

使用道具 举报

23#
 楼主| 发表于 2020-3-10 21:37 | 只看该作者
hred9D 发表于 2019-11-8 15:58
科学量化分析,看出了与AZ的差距。
最笨的单盘分析。拿最新的LZ分析AZ棋谱,中盘战中的选点,AZ的有的关键 ...

Game016目前KataGo无盲点。LeelaZ267也没问题。
但是Game020的很多点需要高算力,有些点是盲点。
原因在于训练量。现在LeelaZ刚到19M,KataGo谱量更少,大概10M以下。
AZ训练量接近30M


回复 支持 反对

使用道具 举报

24#
发表于 2020-3-13 13:17 | 只看该作者
本帖最后由 hred9D 于 2020-3-13 13:22 编辑

公布的最强的AZ训练棋谱是哪一局呢?谷歌是挑选后公布的。
是Extended Data Figure 6 - AlphaGo Zero 40 block vs AlphaGo Master中的
第Game_020.sgf局
AZ执黑胜阿尔法大师?




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

25#
 楼主| 发表于 2020-4-1 15:10 | 只看该作者
hred9D 发表于 2020-3-13 13:17
公布的最强的AZ训练棋谱是哪一局呢?谷歌是挑选后公布的。
是Extended Data Figure 6 - AlphaGo Zero 40 b ...

你是说比赛谱吧,局时2小时。

我认为应该是AGZ两小时自我对战的第20局[链接:Game020] 论文"Extended Data Figure 4"部分。
毕竟AGZ对战自己的胜率(执白)才60%左右,而对战AG-master胜率到了89%。

AGZ对战AG-master的棋型有个基本布局,2、8、10、14、16、18、20的前50手一致性非常高。
可以说master对那个二间高夹认识不够,总是吃亏。之所以认识不够是因为往前回溯,布局认识落后于zero,点三三玩的不够深。
zero玩到腻,征子认识清楚,角部定式已经改飞挂或者护角了。真正能让zero放招的只有zero(个人观点)。



回复 支持 反对

使用道具 举报

26#
 楼主| 发表于 2020-4-1 15:11 | 只看该作者
下面说说我对这一谱(AGZ-Game020)的看点:

第150手,二路妙手简直吴清源附体!这一谱我最喜欢这一招。
这个盲点目前只有katago(40B-s238)有机会下出。
katago(40B-s238)的神经网络权重和katago(40B-s192)和LZ270一样,L18只有0.5的policy。
但是只有katago(40B-s238)把L18放入了前8的计算选点,超高计算量可以下出。

第159手,20b权重(minigo、elfV2、轰烈20b-lz)在50万以上的计算量可以下出。
但是直到LZ249之后,40B权重才能用类似计算量算出,否则需要成倍的计算量,非常难。
接下来的第160手LZ270还搞不清楚提掉还是切断,Katago已经非常明确的切断了,单看这一招,是katago强。


但是单从几个、或者数十个盲点看权重能力,不能得出确定可靠的结论,权当自娱自乐了。
首位计算量50万每步,katago40b-s192和LZ270已经能够解释Game019,只存在148/154/161/184/185这5个盲点(katago40B-s238有改善)。
目前katago已经有了自己的评分系统,在阿尔法狗的迷雾里面,也就是这些2小时对战谱比较有价值,数量太少,只能做局面评估测试用。

我感觉katago高计算量已经到了ELO5125 - 5185之间,LZ270在ELO4900 - 5000之间,低于katago200分。
如果低估一档,katago到ELO5025-5125之间,完全没有问题,至少在解读Game019上KataGo40B-s192给出了高吻合率高评分(黑90%:84分,白85%:77分),Game018上给出了高吻合率和低评分(黑79.5%:70.7分,白81.1%:71.9分),选点条件:前3选点且计算量5%以上。

现在看,katago已经建立了棋力评估体系,以前未知阿尔法狗的棋力,现在已经接近完全了解了,我会用最新40B-s238权重再次复盘Game016-Game020,做最后一个更新。
回复 支持 反对

使用道具 举报

27#
发表于 2020-4-1 15:34 | 只看该作者
本帖最后由 lxjtt09 于 2020-4-1 15:48 编辑

楼主分析非常好,已收藏。感觉katago中后盘比leela精准。不过里拉270也很强了,对卡塔狗30b布局经常占优,中盘初期不落下风,偶尔能完胜一盘。当然更多的是中盘中后期无法抵挡katago的精准计算被击溃。
回复 支持 反对

使用道具 举报

28#
发表于 2020-4-1 17:13 | 只看该作者
nan 发表于 2020-4-1 15:11
下面说说我对这一谱(AGZ-Game020)的看点:

第150手,二路妙手简直吴清源附体!这一谱我最喜欢这一招。

想法不错,有些意义!只可惜楼主的配置不太高,如果能用高配置的机器跑跑估计效果会更好!
你说的150像吴清源附体,太过了,这个大概业余棋手也能算出来。
后面好像黑棋在退让,261断是成立的,居然没看到。。。
能挑出双方的错误,说明katago现在的实力应该不弱于阿尔法Zero!本来阿尔法Zero研究方向就是正确的,如果不能超越就说明老师指引的方向有错误。超越只是时间的问题。。。

吻合率很高啊。。。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

29#
发表于 2020-4-1 17:20 | 只看该作者
nan 发表于 2020-3-10 20:57
分别使用
KataGo1.3.3 g170 40 block s1.35G
KataGo1.3.1 g170 20 block s1.91G

现在的katago已经升级到1.35版本,针对芈式飞刀也做了策略性针对,不存在中刀的问题了!赶快升级吧!
回复 支持 反对

使用道具 举报

30#
发表于 2020-4-5 09:55 | 只看该作者
nan 发表于 2020-4-1 15:10
你是说比赛谱吧,局时2小时。

我认为应该是AGZ两小时自我对战的第20局[链接:Game020] 论文"Extended  ...

你是对的,应该是这一局。仔细看了谷歌的说明书

【Extended Data Figure 5 - AlphaGo Zero 40 block self-play games】
这是40 block在40天内的自学历程
精选AlphaGo Zero少年期不需要人类知识,40b从18K开始自我强化学习,互搏的20局供人类参考。AlphaGo Zero经过大约40天2900万场自玩游戏的训练后,以 89 :11 的比分击败了AlphaGo Master(AlphaGo2.0版本),AlphaGo Master在2017年5月乌镇AI峰会上击败了围棋世界冠军柯洁。

【Extended Data Figure 6 - AlphaGo Zero 40 block vs AlphaGo Master】
40b的AlphaGo Zero已经没有人类对手,因为AlphaGo Master在2017年5月乌镇AI围棋峰会上击败了围棋世界冠军柯洁。东方不败AlphaGo Master,惨败于40b的AlphaGo Zero。
这是40 block训练40天的AlphaGo Zero对AlphaGo Master版本的对弈。
精选AlphaGo Zero青年期对AlphaGo Master,AlphaGo Zero优胜20局(胜率 89 :11比分)供人类参考。

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2024-4-19 21:49 , Processed in 0.141997 second(s), 17 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表