飞扬围棋

标题: minigo 权重的对战 [打印本页]

作者: lu01    时间: 2019-1-24 05:10
标题: minigo 权重的对战
https://cloudygo.com/v15-19x19/eval-model/1005?sorted=False 不知道与lz比怎么样
作者: lu01    时间: 2019-1-24 05:20
贴吧说的  回复 12楼. 听说现在minigo已经吊打ELFv1,和40b的里拉202号官权55开,minigo还只是19b*256f而已
作者: lu01    时间: 2019-1-24 06:11
转lz格式脚本  https://github.com/gcp/leela-zero/blob/next/training/minigo/convert_minigo.py
作者: lu01    时间: 2019-1-24 08:04
https://userscloud.com/wd0tqdqkqvia

D:\>d:\leela-zero-0.16-win64\leelaz.exe -w 939-heron.gz
Using 2 thread(s).
RNG seed: 4878283789657530464
Leela Zero 0.16  Copyright (C) 2017-2018  Gian-Carlo Pascutto and contributors
This program comes with ABSOLUTELY NO WARRANTY.
This is free software, and you are welcome to redistribute it
under certain conditions; see the COPYING file for details.

BLAS Core: Haswell
Detecting residual layers...v2...256 channels...19 blocks.
Initializing OpenCL (autodetecting precision).

Wavefront/Warp size: 32
Max workgroup size: 1024
Max workgroup dimensions: 1024 1024 64
Using OpenCL half precision (at least 5% faster than single).
Setting max tree size to 4077 MiB and cache size to 453 MiB.

Passes: 0            Black (X) Prisoners: 0
Black (X) to move    White (O) Prisoners: 0

   a b c d e f g h j k l m n o p q r s t
19 . . . . . . . . . . . . . . . . . . . 19
18 . . . . . . . . . . . . . . . . . . . 18
作者: lu01    时间: 2019-1-24 09:52
https://userscloud.com/cat842csy8es
990权重
作者: liangr    时间: 2019-1-24 10:12
楼主,939和990有什么区别?
作者: lu01    时间: 2019-1-24 10:43
1005权重
https://userscloud.com/w598ji58xolm
作者: yunhuo    时间: 2019-1-24 11:09
lu01 发表于 2019-1-24 10:43
1005权重
https://userscloud.com/w598ji58xolm

1005是最新的权重吧,更新的很快呀,990,993到1005.
麻烦问一下可以用leela加载的吧

作者: gfchy    时间: 2019-1-24 11:14
可以加载
作者: gfchy    时间: 2019-1-24 11:15
刚试了一下939的 和leela很类似 棋力同时间 碾压gx98
作者: gfchy    时间: 2019-1-24 12:56
这好难下载 不知道是什么鸟站 老掉线
作者: 天地一_AD84H    时间: 2019-1-24 17:10
根本打不开,能不能放在网盘上分享权重?谢谢!
作者: 淡泊    时间: 2019-1-24 17:27
不行,打开是什么恶意网站,或者连不上。
作者: jcjcw3    时间: 2019-1-24 18:44
本帖最后由 jcjcw3 于 2019-2-8 21:21 编辑

minigo990网盘:https://pan.baidu.com/s/1gmjeLIPEUVDcUFlfu6bX_w  990评分4478
1005评分4367

作者: lhtj326    时间: 2019-1-24 19:10
下不了
作者: 天地一_AD84H    时间: 2019-1-24 22:13
谢谢,可用
作者: lu01    时间: 2019-1-24 22:18
gcp说Networks don't have perfect play, nothing new here.
作者: ultraungar    时间: 2019-1-24 23:11
https://cloudygo.com/v15-19x19/eval-graphs
Best model        000990-cormorant
作者: gfchy    时间: 2019-1-25 00:41
这三个迷你go的权重 三盘均败给lm系列的gx5b 中盘的死活计算 有很大问题
作者: lu01    时间: 2019-1-25 07:49
gcp把评价改成
Networks don't have perfect play or score estimation, nothing new and nothing to fix here.
https://github.com/gcp/leela-zer ... uecomment-457196564
作者: lu01    时间: 2019-1-26 08:44
v16也开始了
作者: gfchy    时间: 2019-1-26 10:34
就目前迷你do的水平 比lz差很多 计算力偏弱
作者: keexisun    时间: 2019-1-26 14:39
minigo低po下算路貌似不稳,高po就相当厉害了,特别是后半盘算路精湛
目前估计在同时间每步的条件下,应该是最强的
作者: gfchy    时间: 2019-1-26 15:04
10秒一手 还是不行 估计可能要高配 ?
作者: 天地一_AD84H    时间: 2019-1-27 01:23
990比1005强吗?

作者: gfchy    时间: 2019-1-27 02:08
可能939最强 只是 10秒一手 还是很弱
作者: yunhuo    时间: 2019-1-27 10:43
gfchy 发表于 2019-1-27 02:08
可能939最强 只是 10秒一手 还是很弱

慢棋的这些权重的棋力还是不错的,今天我试了一下,慢棋,990以150手屠龙ELF

作者: gfchy    时间: 2019-1-27 10:54
嗯 你设置多长时间一手?
作者: yunhuo    时间: 2019-1-27 11:41
gfchy 发表于 2019-1-27 10:54
嗯 你设置多长时间一手?

我机器配置不高,设置是2分钟必须下棋或一个选点思考到6000po就自动下,实际上绝大部分都是第二种情况,整盘棋大体上下了不到三个小时

作者: lu01    时间: 2019-1-27 14:55
minigo的历史说明
https://cloudygo.com/RESULTS
Andrew很长一段时间没有更新MiniGo RESULTS.md,所以这里......





跑 |board_size|块|过滤器|上演了|型号数量|游戏数量


v16 19 40 256 X00 TPU
正在运行:将块大小增加到40。
v15 19 20 256 X00 TPU 1008 25.6M
巨大的成功:使用我们的运行大型管道,这是我们最快的开始。改为初始Q到损失使v14变得更强,所以我们开始v15,初始Q丢失。这次运行比我们之前的运行更强大。在比赛结束时,我们用LZ(50-50 vs LZ201)和ELF(40-60%winrate取决于型号)进行了一系列比赛,这真是太棒了。
v14 19 20 256 X00 TPU
开始使用Cloud Bigtable测试我们的新数据管道,周围模型475安德鲁从使用init Q更改为父级到初始化Q到丢失。这似乎对政策和价值敏锐度产生了负面影响,类似于ELF中所见。
v13 19 21 256 X00 TPU 704 23.0M
成功案例:从类似于AlphaGo Master的监督模型开始。
v12 19 20 256 X00 TPU 1000(确切地说)24.6M
成功:v11的再现性:证明RL是稳定的。
v11 19 20 256 X00 TPU 171 6.6M
成功:测试了一个实验。
失败:Init到Q非常不稳定,我们提前停止了运行。
v10 19 20 256 X00 TPU 865 22.3M
成功:跑到TPU(非常快),我们“完成”了跑步。
v9 19 20 128 TPU 737 14.0M
成功:跑到TPU(非常快),我们“完成”了跑步。了解随机旋转的重要性。
v8 19 20 256 TPU 5 100K
成功案例:证明我们的TPU kubernetes集群有效。
v7 19 20 128 GPU 529 7.8M
成功:Golden Chunks用于训练,随机轮换训练
失败:忘记写sgfs开始运行
v5 19 20 128 GPU 581 4.8M
成功案例:GPU集群,强大的Amatuer
v3 9x9 10 32 CPU 496 3.3M
成功:代码全部运行和模型训练
最初是v3,9x9跑。 v2和v1(如果存在的话)会丢失到历史记录中。
在v3之后有v5。注意:我们似乎无法连续开始两次运行,因此基本上缺少了一半的数字

关于v5知之甚少,档案馆建议它是一个10块,128个过滤器架构,5M游戏。
口头历史传递给站点管理员站点管理员告诉操作员在接近结束时测试了几个学习率变化。

我们都喜欢Python它是一种很棒的语言,但有时你会渴望速度。 v7使用C ++二进制文件直接引用“HyperSpeed”。
v7取得了成功:更好的数据编组,图3的介绍,糟糕的辞职率图表,......
它的问题:我们忘了写sgfs,我们提前降低学习率,......

最好不要说v8也不要*颤抖*提到它的名字Gradients

v9是20层模型。它也是第一个使用八种对称性训练的模型(?)。或者是吗?
“我身体感到恶心” -  AMJ发现use_random_rotation默认为False三天。

从来没有满足,MiniGo团队用v10直接推过“HyperSpeed”到“PetaFlops Speed”。
这是真正的交易20层,256过滤器全尺寸模型,燃烧640云TPU。
我认为这是重现AlphaZero最重要的尝试:
我们使用公布的学习费率表,批量大小......(TODO ANDREW)。
安德鲁勇敢地监督了不良的辞职率,并将其保持在5%以下。
我们的评估显示,这是一个强大的模型,超越了我们之前的顶级模特,达到了专业实力(v7可能也有?)。

我告诉安德鲁“初到0是愚蠢的”。
Init为0表示将新节点的值(Q)初始化为0(偶数位置)。
我当时说了,我现在就说,这是一个坏主意,它导致一种奇怪的行为:
在顶级策略节点上使用第二个读数之前,MCTS会探索所有361个移动。
这仍然是纸张所说的,我们预计它会很快失败,所以我们测试了它。
TL; DR:v11失败。胜利率不稳定,不可能控制不好的辞职。

对于v12,我们测试了我们模型的可重复性。
我们还原了v11更改并再次运行v10(我们更改了virtual_loss = 2)。
virtual_loss是我们用来通过批处理8个(或现在2个)位置并同时评估它们来加速模型的参数。
TL; DR:v11类似于v10,这是对稳定性和引导条件的测试。
我们没有看到任何可测量的差异,所以我们感觉良好,我们的RL设置是稳定的。

作者: 夏天_Z5rwS    时间: 2019-1-27 20:39
请问这个用什么跑呢?
可以加载到猫老师的 ana软件中吗?怎么弄呢?
作者: lu01    时间: 2019-1-27 21:18
应该可以用leelaz加载转换后的权重
作者: lu01    时间: 2019-1-28 19:31
目前最强的40b
https://cloudygo.com/v16-19x19/eval-model/463?sorted=True
作者: 渐渐领悟    时间: 2019-1-28 20:34
lu01 发表于 2019-1-28 19:31
目前最强的40b
https://cloudygo.com/v16-19x19/eval-model/463?sorted=True

我们没有那么好的翻墙术,打不开啊

作者: 夏天_Z5rwS    时间: 2019-1-28 21:34
楼上这个怎么下载?

作者: yunhuo    时间: 2019-1-28 21:43
夏天_Z5rwS 发表于 2019-1-28 21:34
楼上这个怎么下载?

应该还没提供下载呢

作者: yunhuo    时间: 2019-1-28 21:44
lu01 发表于 2019-1-28 19:31
目前最强的40b
https://cloudygo.com/v16-19x19/eval-model/463?sorted=True

目前有提供下载吗



作者: lu01    时间: 2019-1-29 05:43
仍然是 https://cloudygo.com/v16-19x19/eval-graphs
作者: lu01    时间: 2019-1-29 07:57
509比463厉害了
作者: nako350    时间: 2019-1-29 08:21
用什么引擎跑的?给大家分享下参数引擎啊~~
作者: lu01    时间: 2019-1-29 08:34
这是他的官网,用minigo引擎
作者: gfchy    时间: 2019-1-29 08:35
你们能下载么 ?
作者: gfchy    时间: 2019-1-29 09:00
网页是打开了 点哪下载?
作者: nako350    时间: 2019-1-29 09:04
版主,就像平时我们上上野狐弈城之类的。用什么引擎好啊?单卡双卡什么参数好用啊?
作者: 夏天_Z5rwS    时间: 2019-1-29 10:13
看不懂怎么下载
作者: yunhuo    时间: 2019-1-29 10:37
lu01 发表于 2019-1-29 08:34
这是他的官网,用minigo引擎

有转换成leela引擎的权重吗,而且,就算官网那个怎么下载,能不能简单说说

作者: 关晓辉    时间: 2019-1-29 10:49
谢谢


作者: lu01    时间: 2019-1-29 18:18
转换后权重下载
https://cloudygo.com/converted_model/v16-19x19/models/
作者: lu01    时间: 2019-1-29 18:25
v15 990最强
https://cloudygo.com/converted_model/v15-19x19/models/
作者: yunhuo    时间: 2019-1-29 20:24
本帖最后由 yunhuo 于 2019-1-29 20:30 编辑
lu01 发表于 2019-1-29 18:18
转换后权重下载
https://cloudygo.com/converted_model/v16-19x19/models/

非常感谢,看了各权重得分,990>939>1005,是这个排名吧
作者: keexisun    时间: 2019-1-29 20:49
40b目前的权重只能算半成品,初始胜率偏差太大,执黑初始胜率居然是35%,还有待训练
作者: lu01    时间: 2019-1-29 22:06
这么好的资源,拿来接着训leelaz,多好
作者: lu01    时间: 2019-1-30 06:57
盘数多但提升慢 560        4151 (±83)
作者: 天地一_AD84H    时间: 2019-1-30 08:16
509下不过LZ202
作者: gfchy    时间: 2019-1-30 11:24
这玩意要么强机 要么慢棋 否则 没啥用 计算的比lz慢很多
作者: jcjcw3    时间: 2019-1-31 17:11
626权重评分最高呀,楼主放个链接吧,谢谢!

作者: lu01    时间: 2019-1-31 20:47
作者没放出来转换后的,原始的可以按照下面网页
https://github.com/tensorflow/minigo
作者: lu01    时间: 2019-1-31 22:32
现在665最强
作者: yunhuo    时间: 2019-2-1 09:09
lu01 发表于 2019-1-31 22:32
现在665最强

665是40B的吧,这样的大权重在强机上才能充分发挥实力,如果在弱机很多时候还不如小权重

作者: 夏天_Z5rwS    时间: 2019-2-1 09:36
什么配置才算强机呢?不懂。
作者: yunhuo    时间: 2019-2-1 10:06
夏天_Z5rwS 发表于 2019-2-1 09:36
什么配置才算强机呢?不懂。

那什么,前天我看了一款笔记本的评测视频,最新的2080的GPU,i9处理器,32G运存,光电源就有两个,重量13斤往上,价格4万元左右,这样的绝对堪称强机标杆
吓到没,哈,开玩笑的,实际上能跑的动40B的强机最起码要有个1060以上的独立显卡,运存最好也有个8G以上

作者: lu01    时间: 2019-2-2 14:46
手机才说运存
作者: lu01    时间: 2019-2-2 14:46
https://cloudygo.com/v16-19x19/eval-graphs minigo最新排名
作者: lu01    时间: 2019-2-3 05:13
更新了https://cloudygo.com/converted_model/v16-19x19/models/
作者: lu01    时间: 2019-2-3 05:37
下载转换方法 https://github.com/leela-zero/leela-zero/issues/2183#issuecomment-459962389
作者: jcjcw3    时间: 2019-2-3 09:23
本帖最后由 jcjcw3 于 2019-2-3 13:22 编辑

谢谢!
作者: keexisun    时间: 2019-2-3 11:51
目前最强805权重,征子识别有问题,识别要滞后两手
估计要完善,至少还得900号权重以后了
作者: gfchy    时间: 2019-2-3 12:25
各位试用了么  
作者: gfchy    时间: 2019-2-3 13:11
在测试 这也太慢了 。。。比lz慢太多。。等吧 ,蜗牛的权重 它可能很厉害 但是 等不起。。
作者: landa    时间: 2019-2-3 15:30
感觉比leela的40b权重慢了近一半。难道leela对亲儿子有优化?
作者: lu01    时间: 2019-2-3 18:32
什么叫慢?怎么测试的
作者: nako350    时间: 2019-2-3 20:39
貌似征子有问题
作者: yunhuo    时间: 2019-2-4 08:39
lu01 发表于 2019-2-3 18:32
什么叫慢?怎么测试的

用leela引擎跑leela权重,同时间计算量明显要比跑minigo的快,例如,40B的Leela每秒跑100po,40B的minigo可能只能跑60po,大概就是这个意思。我在跑990的时候就发现有这个问题,但貌似不影响最后的输赢,minigo的权重最后基本都是赢。

作者: lu01    时间: 2019-2-4 08:57
yunhuo 发表于 2019-2-4 08:39
用leela引擎跑leela权重,同时间计算量明显要比跑minigo的快,例如,40B的Leela每秒跑100po,40B的minigo ...

知道了,是否小数精度的问题?
作者: yunhuo    时间: 2019-2-4 11:39
lu01 发表于 2019-2-4 08:57
知道了,是否小数精度的问题?

那就不知道了,minigo是比较新的,有各种小问题到不奇怪,日后改善就好

作者: keexisun    时间: 2019-2-4 12:01
本人用LZ0.16版测试的速度很正常,和跑LZ40b没什么区别
作者: lxjtt09    时间: 2019-2-4 12:05
805主要有征子bug.
作者: lu01    时间: 2019-2-4 12:47
800以上强多了,前15有10个
作者: lu01    时间: 2019-2-4 12:53
排行榜

Ratings from        89536 games        rating        uncertainty
Best model        000882-glory        4452        ± 40
2        000894-affray        4436        ± 70
3        000805-pallas        4428        ± 26
4        000833-black-prince        4419        ± 29
5        000883-acheron        4380        ± 37
6        000892-alliance        4362        ± 45
7        000797-centaur        4360        ± 24
8        000866-brave        4353        ± 30
9        000856-wanderer        4338        ± 30
10        000884-perseus        4328        ± 36
11        000864-parthian        4303        ± 28
12        000715-trusty        4300        ± 20
13        000827-expedition        4262        ± 29
14        000699-lively        4256        ± 20
15        000863-gibraltar        4256        ± 30

作者: lu01    时间: 2019-2-6 06:32
分没涨,900以上的多了

Ratings from        105523 games        rating        uncertainty
Best model        000930-goliath        4450        ± 26
2        000894-affray        4400        ± 23
3        000984-prospero        4396        ± 42
4        000805-pallas        4337        ± 20
5        000882-glory        4336        ± 21
6        000942-duchess        4329        ± 23
7        000899-kingfisher        4323        ± 22
8        000959-phoenix        4309        ± 26
9        000833-black-prince        4301        ± 21
10        000905-hydra        4298        ± 23
11        000960-conqueror        4293        ± 28
12        000938-hercules        4291        ± 30
13        000965-coronation        4276        ± 39
14        000883-acheron        4274        ± 23
15        000892-alliance        4272        ± 24
作者: lu01    时间: 2019-2-8 08:44
v13 权重 https://cloudygo.com/converted_model/v13-19x19/models/
作者: yunhuo    时间: 2019-2-8 09:31
lu01 发表于 2019-2-8 08:44
v13 权重 https://cloudygo.com/converted_model/v13-19x19/models/

V13是多少B的权重?棋力如何?有排名什么的吗?

作者: lu01    时间: 2019-2-8 12:37
v13排名 https://cloudygo.com/v13-19x19/eval-graphs
介绍 https://cloudygo.com/RESULTS
作者: keexisun    时间: 2019-2-12 12:18
貌似40b的训练效果不太好,
又重新去训练20b的了,不过貌似用的新方法
作者: lu01    时间: 2019-2-17 21:05
keexisun 发表于 2019-2-12 12:18
貌似40b的训练效果不太好,
又重新去训练20b的了,不过貌似用的新方法

谷歌有钱任性

作者: yunhuo    时间: 2019-2-19 20:03
本帖最后由 yunhuo 于 2019-2-19 20:05 编辑
lu01 发表于 2019-2-17 21:05
谷歌有钱任性

貌似最新的V17的权重也快开始放了

作者: lu01    时间: 2019-2-20 05:35
作者说v17转不了lz格式
作者: nako350    时间: 2019-2-20 08:10
你们觉得好用吗?还只是觉得新鲜而已?反正我觉得一点都不好用
作者: yunhuo    时间: 2019-2-20 13:08
nako350 发表于 2019-2-20 08:10
你们觉得好用吗?还只是觉得新鲜而已?反正我觉得一点都不好用

没什么好用不好用吧,就是一个权重,目前对比最强的990略弱于最新的elfv2





欢迎光临 飞扬围棋 (http://flygo.net/BBS/) Powered by Discuz! X3.2