飞扬围棋

标题: sai开始训练19路了 [打印本页]

作者: lu01    时间: 2019-10-28 14:18
标题: sai开始训练19路了
http://sai.unich.it/
参加训练需要先注册


作者: lu01    时间: 2019-10-28 14:18
9路非常强了
作者: lu01    时间: 2019-10-28 14:21
进展

Vandertic于2019年10月18日编辑本页,共2次修订


草案


SAI学习管道不同于Leela Zero。


LeelaZero是基于AlphaGoZero的论文,而SAI遵循AlphaZero论文中描述的修改。


主要的区别在于,在alphago zero文件和leela zero项目中,存在门控,这意味着一个新训练的网络被提升为最佳网络,从而进行自我游戏,前提是有一些统计证据表明它比前一个网络有所改进。更准确地说,比赛进行了400场,如果获胜率至少为55%(与投币公平的2σ偏差),那么网立即被提升。


在alphazero文件中没有门控:训练是连续的,在250000个游戏的移动缓冲区上,每1000个训练步骤产生一个新的网络,立即升级,并投入25000个游戏。


在我们使用7x7和9x9sai的实验运行中,我们看到第二种方法确实非常健壮,即使没有门控,也可以观察到一些强度振荡。最后,我们达成了一个介于两者之间的协议:我们遵循alphazero方法,但在每一步,我们都会训练少量的网络,并推广一个在之前的网络中表现最好的网络,即使胜率低于50%。这些晋级比赛由少量的比赛组成,远远少于400场;事实上,比赛的目的并不是为了选出最佳的候选人,而是为了避免非常糟糕的比赛,以确保比赛的稳健性。


sai管道周期比alphazero快,因为我们没有巨大的资源,我们希望在检查进度的同时,通过执行较小的中间步骤,尽可能地提高效率。


循环如下。


gen=0,current_net=random,n=1;

current_u net玩2560个完整的自玩游戏,带有变量komi,根据current_u net的评价进行分配;

当前网络从以前游戏的随机位置开始玩自玩游戏的分支;

当游戏数达到3072个自玩游戏时,在前n代自玩游戏的基础上开始训练;

在训练过程中,产生了数量不等的候选网络(目前,在2000个训练步骤中,一个接一个地产生了10个网络);

一旦有候选人,新的候选人网络和当前的候选人网络之间就会添加晋升匹配。这些比赛可以被识别,因为它们有50场比赛长;

当促销匹配结束时,确定最佳候选网络;用所选网络表示;

本网通过玩自玩游戏分支,直至计数达到3840;

在几个最近的网络(在gen-k世代提升的网络,k在{1,2,5,8,11})和select_net之间添加参考匹配,以获得对select_net elo更精确的评估。这些比赛可以被识别,因为它们有40场比赛长;

如果gen是4的倍数,则在面板中的16个网络和selected_net之间添加面板匹配,再次获得selected_net elo的更精确评估。这些比赛有30场比赛长,所以可以确定;

gen++,current_net=选择的_net,如果合理,则n++;

进入步骤2;
作者: leexch    时间: 2019-10-28 15:33
虽然机器翻译得乱七八糟,但基本上能看得懂,好像和katago区别不大
作者: lu01    时间: 2019-10-28 20:33
23w盘训练出leelaz 110w盘的强度
作者: hred9D    时间: 2019-10-28 20:39
lu01 发表于 2019-10-28 20:33
23w盘训练出leelaz 110w盘的强度

训练提升的速度非常快

作者: 小财神    时间: 2019-10-29 09:27
怎么训练和注册
作者: lu01    时间: 2019-10-29 11:23
http://sai.unich.it/user-request
注册会收到1个电子邮件,选择邮件中的url激活
训练
https://github.com/sai-dev/sai/releases/ 下载最新版,运行解压缩到一个文件夹
然后运行里面的sa.hta文件,填写刚才注册的用户名密码

作者: lu01    时间: 2019-10-29 11:24
hred9D 发表于 2019-10-28 20:39
训练提升的速度非常快

他跳过了5x64
直接6x128

作者: hred9D    时间: 2019-10-29 20:06
SAI 0.17.4用sabaki加载里拉权重也是可以运行的
作者: lu01    时间: 2019-10-30 07:13
参加训练的人多起来了
作者: lu01    时间: 2019-10-30 08:11
sai36比lz24强 ,还不如lz30
作者: nan    时间: 2019-10-30 13:16
lu01 发表于 2019-10-28 20:33
23w盘训练出leelaz 110w盘的强度

楼主有个笔误,sai的训练量在13w盘时击败了110w盘强度的lz。
我注册的名字是GeorgeShangHai,参加了最近4个权重v33-v36四个权重的跑谱。

sai的棋力成长非常快,观察sai在分析模式下的表现,去掉nrsymm参数
1. sai036在棋力超过lz024的情况下,开局变化更多,棋局中死活棋更强。
2. 100k计算量下,lz024只有星位开局一种;sai032有点22、54、边星5路飞等。
3. 100k计算量下,sai032的热图比lz024更均匀,lz024热图的中腹和边有明显空缺。
4. 1k计算量下的热图,sai032是侧箭头形态,lz024是四宽边形态,而lz030则是以角星位为主的点状热图了。


我在2060上跑了一次1秒1步的对战,每步计算量sai大概是2k左右,lz大概是5k左右。
在做活各自几个棋块中,lz的一块假眼棋在争斗中死掉了,sai很早就知道抓lz这块棋。

个人感觉sai目前重视中腹模样,凭借死活能力,不怕对方角块出棋。不知道这种状态持续多久。



作者: nan    时间: 2019-10-30 13:22
补充一下
lz030走星位,但不知道点三三,不会托退定式
lz057走星位,点三三接扳托长,少走连扳定式,会走托退定式
作者: lu01    时间: 2019-10-31 18:12
平均7小时一个新权重
作者: lu01    时间: 2019-11-1 08:30
本帖最后由 lu01 于 2019-11-1 13:53 编辑

sai43对lz030胜率80%,对lz033 55%
与lz035有胜负
作者: lu01    时间: 2019-11-2 18:17
sai48比lz36强,比lz40弱
作者: lu01    时间: 2019-11-2 21:23
20万局了
作者: lu01    时间: 2019-11-3 14:50
作者要提升训练的visits了
作者: nan    时间: 2019-11-4 09:13
为楼主加油。
作者: lu01    时间: 2019-11-5 06:07
sai57 与lz40差不多了
作者: lu01    时间: 2019-11-6 05:25
sai60超过lz40了
作者: 弈林妖刀    时间: 2019-11-7 15:58
有没有已经弄好的可以加载sai的。。。软件啊。。。
作者: lu01    时间: 2019-11-7 18:28
这个可以 https://github.com/wonsiks/BadukMegapack
作者: 弈林妖刀    时间: 2019-11-7 21:13
lu01 发表于 2019-11-7 18:28
这个可以 https://github.com/wonsiks/BadukMegapack

悲剧要翻墙才能打开。。 sai我已经注册了,并下载最新权重还是无法跑谱。。。

作者: lu01    时间: 2019-11-7 22:11
看这篇的命令行https://github.com/sai-dev/sai/wiki/Client-server-communication
作者: 弈林妖刀    时间: 2019-11-8 14:24
network connection to server failed。一直提示这个。。最新权重在主页下载到networks也一样。。
作者: 弈林妖刀    时间: 2019-11-8 14:41
原来如此,自个研究了下,点击sai  html应用程序,输入注册好的id和密码确认后,用下载的最新权重放入networks中 开始跑谱了。。
作者: 弈林妖刀    时间: 2019-11-8 17:45
lu01 发表于 2019-11-7 22:11
看这篇的命令行https://github.com/sai-dev/sai/wiki/Client-server-communication

有跑谱交流群吗?

作者: nan    时间: 2019-11-8 19:23
楼主贡献一个qq群吧
作者: lu01    时间: 2019-11-10 19:35
sai74和lz58互有胜负
作者: nan    时间: 2019-11-10 22:52
我测试后发现,SAI v1000 对 LZ v1600 在用时上比较公平,毕竟LZ是5*64的网络,速度要快一些。
大致1.5倍的用时差距,不过对比较棋力影响不大,因为处在快速提升棋力过程中,差距很明显,同V能赢下来的,同时间也差不多。
作者: 弈林妖刀    时间: 2019-11-12 14:45
sai跑谱训练群 QQ群:628856692
作者: 狐爸爸    时间: 2019-11-13 18:22
笔记本能跑吗?
作者: leexch    时间: 2019-11-13 20:25
狐爸爸 发表于 2019-11-13 18:22
笔记本能跑吗?

可以跑,如果用GPU版本的,注意散热问题
CPU的也可以跑,就是太慢了

作者: lu01    时间: 2019-11-13 20:25
狐爸爸 发表于 2019-11-13 18:22
笔记本能跑吗?

能跑leelaz就能跑,因为权重小,配置差点没关系
作者: leexch    时间: 2019-11-14 09:21
试过了,GPU版本在我的电脑上闪退,更新显卡驱动和系统,均不行,不知道什么问题
作者: lu01    时间: 2019-11-14 19:15
sai87和 lz68有胜负
作者: lu01    时间: 2019-11-16 05:58
作者修改了学习率,sai棋力突然提高了
作者: lu01    时间: 2019-11-16 22:00
机器人 https://online-go.com/player/695086
作者: lu01    时间: 2019-11-17 03:23
sai 96又提高很多
作者: 弈林妖刀    时间: 2019-11-17 14:36
lu01 发表于 2019-11-16 05:58
作者修改了学习率,sai棋力突然提高了

难怪这两天明显看它提高了。。。请问哪里看跟lz权重的对比?

作者: lu01    时间: 2019-11-17 17:35
首页带comparison的比赛都是对lz某个权重

作者: 弈林妖刀    时间: 2019-11-17 21:45
comparison没找到这个选顶啊
作者: lu01    时间: 2019-11-17 21:46
右边表格最后一列
作者: lu01    时间: 2019-11-17 21:46
比如: 2019-11-16 22:29        b46c6882   VS  ed002cf3  14 : 0 : 3 (82.35%)        17 / 10        comparison
作者: 弈林妖刀    时间: 2019-11-18 12:32
lu01 发表于 2019-11-17 21:46
比如: 2019-11-16 22:29        b46c6882   VS  ed002cf3  14 : 0 : 3 (82.35%)        17 / 10        comparison

明白了这是在官网主页上权重对比,今天进不去了。。http://sai.unich.it/
作者: lu01    时间: 2019-11-18 15:38
你也可以把sai的exe和vc dll文件复制到leela目录,用validatiion来比较
例如
validation -g 2 -k sai90_lz251 -n cc3.gz -o "-g -v 400 -r 5 -w" -n networks/b346eff6bd20d5e9e2229549916c323a9f3b42e60ecd0a4e16903f4a6967a069.gz -o "-g -v 1 -r 5 -w" -- sai -- sai
作者: 弈林妖刀    时间: 2019-11-19 17:26
lu01 发表于 2019-11-18 15:38
你也可以把sai的exe和vc dll文件复制到leela目录,用validatiion来比较
例如
validation -g 2 -k sai90_l ...

还不会防征子。。。给作者说一下。。。

作者: lu01    时间: 2019-11-19 17:31
已经说过这个
作者: lu01    时间: 2019-11-20 06:46
能胜zen 7d https://lifein19x19.com/viewtopic.php?f=18&t=17023
作者: lu01    时间: 2019-11-22 16:40
elo lz 列表
no|rating|gap|hash
13|9720.5|429.0|LZ081:5e8f3a
12|9291.7|516.0|LZ068:af4f49
11|8775.5|433.0|LZ058:ed002c
10|8342.8|613.0|LZ047:830158
9|7729.8|319.0|LZ040:30004a
8|7410.8|489.0|LZ036:c99f1a
7|6921.9|340.0|LZ030:273a02
6|6581.9|529.0|LZ024:3382a7
5|6053.2|129.0|LZ018:4701bb
4|5924.5|365.0|LZ017:5bcb39
3|5559.8|1039.0|LZ016:fe7a6c
2|4521.1|1100.0|LZ013:1607db
1|3421.2|821.0|LZ009:6f274a
0|2600||LZ006:a11516

elo sai列表
no|rating|gap
110|9638.2|40.0
109|9598.2|20.0
108|9577.8|38.0
107|9540.3|12.0
106|9528|-9.0
105|9536.5|70.0
104|9466.1|82.0
103|9384.5|-38.0
102|9422.6|1.0
101|9421.6|55.0
100|9366.3|85.0
99|9281.5|15.0
98|9266.7|-16.0
97|9282.8|79.0
96|9203.6|135.0
95|9068.3|18.0
94|9049.9|38.0
93|9011.5|55.0
92|8956.3|323.0
91|8633.1|26.0
作者: 罗浩宇    时间: 2020-2-3 11:29
求 加载参数
作者: keeper    时间: 2020-5-29 20:06
不错不错
作者: keeper    时间: 2020-5-31 21:50
厉害了




欢迎光临 飞扬围棋 (http://flygo.net/bbs/) Powered by Discuz! X3.2