飞扬围棋

 找回密码
 注册
搜索
123
返回列表 发新帖
楼主: nan
打印 上一主题 下一主题

用几个权重分析AZ的对战谱

[复制链接]
31#
发表于 2020-4-5 17:34 | 只看该作者
本帖最后由 hred9D 于 2020-4-5 17:35 编辑

katago1.34,40B-s238,最初首位计算是Q11,与LZ270的154k的计算量选点相同,胜率46%左右。高计算量后,算出了AGZ的150二路飞,胜率达到51%以上,但是,随着计算量的增加,katago首选点的胜率下降到48-49%之间,虽然仍然是首选点。当然随着katago计算量变化和胜率波动,L18点的变化图也是不一样的。
159手,katago40B-s238可以初始计算选出,LZ270选点不同,但在前三个选点之中
160手,katago先左边交换后再白3切断,吻合度是存在的。LZ270首选点不同,但选点也排在第二位。

个人感觉,龟兔赛跑,民间的AI随着训练局数的增加和引擎的改进,还是在追赶上AGZ的过程中。。。






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

32#
发表于 2020-4-5 18:45 | 只看该作者
本帖最后由 R141 于 2020-4-5 19:51 编辑
hred9D 发表于 2020-4-5 17:34
katago1.34,40B-s238,最初首位计算是Q11,与LZ270的154k的计算量选点相同,胜率46%左右。高计算量后,算出 ...

个人觉得KataGo可能已经达到了AGZ,哪怕是棋力相近的AI,对战时也可能出现被对方发现盲点而被击败的情况,甚至是相对弱很多AI,也可能击中强AI的盲点,如果能够大致理解AGZ的棋谱,在棋局并非自己所下的情况下,如果只有少数几手可能有问题,棋力可能就差不多了,
AGZ的计算量相当高,与之相比,开源AI如果能分析出AGZ的招数,哪怕是用了比较高的计算量(可能也只是AGZ的零头),也是可以接受的。
个人觉得少数盲点的存在是可以接受的,同时也不能否认在某些局面下,KataGo等AI相较于AGZ有更高见解的可能性。
根据楼主之前的分析,LeelaZero大概有5000分了,从LeelaZero的训练量上看,这个分数很合理,从另一个角度看,MiniGo V17有足够的训练量和一些新的技术,个人觉得MiniGo V17在打上征子补丁后,应该达到或者超过了Master的水准,也就是达到了4850分,LeelaZero相对于MiniGoV17,是要强上一些的,由此看,认为LeelaZero差不多有5000分也是说得通的,根据KataGo对LeelaZero的胜率,认为KataGo达到甚至超过5200分,应该也是比较合理的。




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

33#
发表于 2020-4-5 20:13 | 只看该作者
本帖最后由 hred9D 于 2020-4-5 20:14 编辑

elo评分不太好估算。katago有后来居上的感觉,LZ有点上不去的情况,应该说,对AGZ的棋谱,关键手数的分析和理解还是重要的。
吻合度分析中,民间AI还是可以达到70%以上了,但是胜率波动很大的手数(哪怕只有几手棋不能理解)是不是重点和盲点呢?为什么民间引擎和权重都不能理解这几手棋?是不是与AGZ的关键差距?也是拉开elo的关键?比如148,204,截图是204手




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

34#
发表于 2020-4-5 20:35 | 只看该作者
AlphaGo Zero通过与自己不断挑战来进行提升,不依赖人类数据。此前版本则是通过分析海量棋谱数据进行学习。AlphaGo打败李世石用了3000万盘比赛作为训练数据,而AlphaGo Zero仅用了490万盘比赛数据。经过3天的训练,AlphaGo Zero以100:0的战绩完胜AlphaGo。并且只用了1台机器和4个TPU,而李世石版AlphaGo则用了48个TPU。
谷歌论文是公布了,应该有最关键的部分有所隐瞒吧?不然硬件需求下降不来的。
回复 支持 2 反对 0

使用道具 举报

35#
发表于 2020-4-5 20:44 | 只看该作者
本帖最后由 R141 于 2020-4-5 21:49 编辑

个人认为,如果某一手下下去之后胜率暴涨,通常就是确实的盲点,也就是差距,当然也有少数情况是下到这一手深入计算后才发现了妙手,所以胜率上升。这是一种情况。
你说的这两个点都是胜率下降的情况,个人认为这种情况下不能排除KataGo对这些招法不认同的可能性,这两手棋,KataGo对于148有自认为胜率较高的选点,同时也对AGZ的选点有一定的计算,对于204手,虽然没有立即下出,但在变化图中也下到了,不能认为KataGo完全没有理解,当然,不能否认的是,这些地方也可能确实存在一些差距。

首先我个人认为AGZ也难免存在盲点,假如让AGZ分析KataGo的棋谱,也可能出现类似的情况,在自身作为对局一方的同时,也难免出现盲点,更何况是直接分析其他AI的棋局,一个局面有盲点可以说是这个局面有差距,但不能代表AGZ因此就在其他局面下也更优秀,因为只是分析AGZ的棋谱,所以我们只能看到一方面,当然我这种说法也可能是错误的,我个人觉得这样想是合情合理的。

一个AI,如果原来分析不出盲点,后来能分析出来了,可以说是变强了,但我个人觉得,一个AI,并不需要完全分析出AGZ的棋谱,才能说是达到,如果对于AGZ下出来的局面能完全理解,尤其是在相对较低的算力下,棋力应该已经高出一些了。

elo等级分虽然不能特别精确的估算,但还是可以大概指出一个高度。毕竟AI的强弱,本质上还是要由胜率而定。盲点虽然可以用于判断,但是AI的强弱并不是一个绝对的数值,存在风格上的相互克制,而如果只是通过能不能看出一个盲点判断,个人觉得显得过于绝对了。

哪怕认为LeelaZero是4900分,KataGo 20B有84%的胜率(288elo),也超过了AGZ的5185分,更何况还有30B和40B,这种估算我认为比较保守了。

另外,KataGo不退让的风格可能也是选点不同的原因之一。AGZ有明显的退让,如果让AGZ分析KataGo的棋谱,也会出现退让和不退让的分歧,有些选点也会分析不出来,但是这些点显然不能作为判断水平的依据。


回复 支持 1 反对 0

使用道具 举报

36#
发表于 2020-4-5 20:56 | 只看该作者
hred9D 发表于 2020-4-5 20:35
AlphaGo Zero通过与自己不断挑战来进行提升,不依赖人类数据。此前版本则是通过分析海量棋谱数据进行学习。 ...

谷歌关键参数肯定是有所隐瞒的,LeelaZero早期训练效率也不高,不过KataGo在效率上有了极大的进步,这点是肯定的,另外像是MiniGo也拥有谷歌的TPU资源,训练是很充足的.
回复 支持 反对

使用道具 举报

37#
发表于 2020-4-5 22:37 | 只看该作者
本帖最后由 hred9D 于 2020-4-5 22:40 编辑
R141 发表于 2020-4-5 20:44
个人认为,如果某一手下下去之后胜率暴涨,通常就是确实的盲点,也就是差距,当然也有少数情况是下到这一手 ...

如果对于AGZ下出来的局面能完全理解,尤其是在相对较低的算力下,棋力应该已经高出一些了。

--------------------
对,民间AI的确进步很大了,AGZ两个小时的棋,4个TPU训练的权重,爱好者配置相对而言,低到渣的电脑,使用民间的引擎和权重,很短的分析时间,能够理解到前3手棋,较高的吻合度,的确相当不容易了!也可以说不管多么强大的TPU,你也得按棋理下棋吧!
回复 支持 反对

使用道具 举报

38#
 楼主| 发表于 2020-4-7 11:33 | 只看该作者














看了两位讨论,我获益匪浅。我的配置是单卡GTX2060,纯人是K级水平。现在KataGo已经有一个强度序列,足够让其他AI对号入座。

这个系列管中窥豹,按现在的AI水平来说,展现出的解读差异,只有个别盲点。我把用KataGo-40b-s238,首位计算量100k的分析谱上传,有需要的棋友可以下载看看。感谢KataGo无私的贡献,让普通棋迷们有了这么强大的AI。谢谢楼上几位棋友捧场、指点!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

39#
发表于 2020-4-9 17:16 | 只看该作者
hred9D 发表于 2020-4-5 20:35
AlphaGo Zero通过与自己不断挑战来进行提升,不依赖人类数据。此前版本则是通过分析海量棋谱数据进行学习。 ...

核心技术不可能告诉你,民间这些捣鼓AI算法的高手,他们能想到的问题人家早就碰到而且还更多,只是人家费脑力解决了当然不会告诉你。我们只能在正确的路上慢慢摸索。
回复 支持 反对

使用道具 举报

40#
发表于 2020-4-10 10:41 | 只看该作者
阳光清爽海滩 发表于 2020-4-9 17:16
核心技术不可能告诉你,民间这些捣鼓AI算法的高手,他们能想到的问题人家早就碰到而且还更多,只是人家费 ...

你想多了。绝艺星阵都有针对围棋的优化,但AZ没有。AZ的一切都是建立在通用的指导基础上,不可能针对围棋搞那么多优化。KataGo的设计在效率上比AlphaZero高得多,即在围棋层面比AlphaZero优秀得多(多很多,几十甚至几千倍)。KataGo作者所属以及提供计算资源的企业Jane Street也不是什么野鸡公司。AZ作为DeepMind的实验和KataGo作为Jane Street的实验本质上没太大区别,无非是DM团队更大,实际上DM是不可能花大量的时间去做针对性优化的。有时候别把所谓“核心技术”看得那么神秘比较好,计算机科学方面所谓秘密的“核心技术”本世纪初以后就已经基本不存在了。AI方面现在大概没有什么核心技术是堆算力拼不出来的,如果有,不发表论文被别人抢先发现,或者技术牛人跳槽,亏的远比捂着亏得多。(我就是做人工神经网络研究的)
回复 支持 1 反对 0

使用道具 举报

41#
发表于 2020-4-11 09:36 | 只看该作者
问一下大家:民用AI什么时候可以赶上甚至超过AlphaGo Zero?
回复 支持 反对

使用道具 举报

42#
发表于 2020-4-11 10:18 | 只看该作者
秦秦 发表于 2020-4-11 09:36
问一下大家:民用AI什么时候可以赶上甚至超过AlphaGo Zero?

就是现在,就在当今。katago 40B基本上已经追赶或者已经超越。关键是作者的出发点就是要做一款民用的AI。
但超越不超越其实没有任何意义,这也不是所有做AI的追求的目的!
谁也替代不了AlphaGo带给人类智慧的启迪,谁也代替不了Alpha围棋在这个领域的绝对领袖的地位!
回复 支持 反对

使用道具 举报

43#
发表于 2020-4-13 23:01 | 只看该作者
本帖最后由 hred9D 于 2020-4-13 23:10 编辑

一个趣味测试,LZ6B,最初级的棋力,rtx2060s以首位计算量100k,来分析Game_020的吻合度,结果,黑棋怎么输的都不知道,最后居然以为黑棋胜率70%以上,与katago s238完全相反。当然除了布局黑棋勉强吻合度63%,中盘和官子,吻合度都没有超过60分!其中。白棋第150手,大方向居然与AGZ的一致,第150手排在第2位?!





100k首位计算量






本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 1 反对 0

使用道具 举报

44#
 楼主| 发表于 2021-2-10 20:29 | 只看该作者
天行者 发表于 2020-4-1 17:20
现在的katago已经升级到1.35版本,针对芈式飞刀也做了策略性针对,不存在中刀的问题了!赶快升级吧!

很久没来论坛了,感谢指点!

回复 支持 反对

使用道具 举报

45#
 楼主| 发表于 2021-2-10 20:31 | 只看该作者
hred9D 发表于 2020-4-13 23:01
一个趣味测试,LZ6B,最初级的棋力,rtx2060s以首位计算量100k,来分析Game_020的吻合度,结果,黑棋怎么输 ...

是的,对胜率曲线的描绘,不精确但是很可靠的反映了权重强度。感谢老朋友捧场!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2024-11-26 18:40 , Processed in 0.145441 second(s), 19 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表