飞扬围棋论坛

 找回密码
 注册
搜索
查看: 8565|回复: 9

请教关于KATAGO配置的几个问题

[复制链接]
发表于 2022-6-15 12:51 | 显示全部楼层 |阅读模式
2年前为了用katago,专门买了一台2060super主机,感觉对自己帮助很大。前两天突然心血来潮想优化一下配置文件,结果偶然发现katago在运行时显存使用只有1G,内存使用大概有2G左右,后来发现配置文件里有nnCatchesizepowerofTwo=20,将其改为30后,16G内存直接占满,但搜索速度也没有提升。目前线程数为32,用rt引擎,版本均为最新。权重40b,版本为最新。nnMutexPoolSizePowerOfTwo=16。请教论坛棋友的问题是:1、如何让katago占用显存。2、nnCatchesizepowerofTwo这个值放大之后对整体计算性能又什么帮助?未来如果把内存扩大到128G有没有意义。
回复

使用道具 举报

发表于 2022-6-15 13:33 | 显示全部楼层
1. katago用多少显存好像是katago自己决定的,好像没法设置
2. nnCatchesizepowerofTwo 是用来缓存计算结果的,会如果当前局面在前面已经计算过了,会大大提高速度。 这个单位是2的多少次方个字节,20就是2的20次方, 30就是2的30次方。改30等于大了1024倍也就是1T。当然会不够了。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-6-15 13:37 | 显示全部楼层
SmileFox 发表于 2022-6-15 13:33
1. katago用多少显存好像是katago自己决定的,好像没法设置
2. nnCatchesizepowerofTwo 是用来缓存计算结 ...

多谢指教,这么说大家的显卡显存都只是用1g多吗,这似乎有些浪费,显存没有充分利用。缓存设大没感觉有什么变化,仍然是1200v/s

回复 支持 反对

使用道具 举报

发表于 2022-6-15 22:14 | 显示全部楼层
2060s这么厉害?用的yzy整合包,用2060只有500v/s,后来用6700Xt也只有700V/s以上,40B,按照说明把那个什么线程数设为32以下(推荐2080ti设为32)。其实我不想让显卡吃满,让它可以偷下懒寿命可以长点。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-6-16 10:04 | 显示全部楼层
南岭励仁 发表于 2022-6-15 22:14
2060s这么厉害?用的yzy整合包,用2060只有500v/s,后来用6700Xt也只有700V/s以上,40B,按照说明把那个什 ...

我这个机器就是用来跑katago的,一年最多几百个小时,根本不可能坏的,要跑满才有价值。
回复 支持 反对

使用道具 举报

发表于 2022-6-16 10:26 | 显示全部楼层
心有万象 发表于 2022-6-16 10:04
我这个机器就是用来跑katago的,一年最多几百个小时,根本不可能坏的,要跑满才有价值。

显存应该是跑不满的,就算60b的权重也就几百M。跑katago主要是流处理器在工作。
看跑满没跑满,,听风扇转的声音就好了
转的越响,说明跑的越满。


回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-6-16 10:37 | 显示全部楼层
SmileFox 发表于 2022-6-16 10:26
显存应该是跑不满的,就算60b的权重也就几百M。跑katago主要是流处理器在工作。
看跑满没跑满,,听风扇 ...

是的是的,我现在最大的疑惑就是设置参数后内存跑满了,但是搜索速度和占用30%的时候一样。
回复 支持 反对

使用道具 举报

发表于 2022-6-18 18:59 | 显示全部楼层
本帖最后由 hred9D 于 2022-6-18 19:02 编辑

1、参数配置不要单独修改,是否适合你的硬件,需要测试,回答几个问题,运行后自动生成新文件xinwenjian.cfg,
katago.exe genconfig -model kata1-b40.bin.gz -output xinwenjian.cfg
比如:RT引擎测试 40B,16G,13s,推荐96线程
结论机翻:根据一些测试数据,通过更深入的搜索,每一次倍速可能会获得大约250 ELO。
根据一些测试数据,如果使用800次访问,每个线程的成本可能是7 ELO,如果使用5000次访问,每个线程的成本可能是2 ELO(这会使MCTS变得更糟)。
因此,根据这个基准,如果您打算进行13秒的搜索:
数字搜索线程数=5:(基线)。
数字搜索线程数=10:+141 Elo。
数字搜索线程数=12:+190 Elo。
数字搜索线程=16:+247 Elo。
数字搜索线程=20:+308 Elo。
数字搜索线程=24:+343 Elo。
数字搜索线程=32:+336 Elo。
数字搜索线程=40:+595 Elo。
数字搜索线程=64:+546 Elo。
数字搜索线程=80:+644 Elo。
数字搜索线程数=96:+649 elo(推荐)。
数字搜索线程数=128:+646 Elo。
数字搜索线程=160:+631 Elo。

使用96个数字搜索线程!
2021-04-09 10:28:21+800:GPU-1精加工,处理29654排360批次。


2、安装aida64监测CPU,内存,显卡的运行状态,这是必须的重要的常见的操作!有时卡塔狗会没有正确占用硬件资源。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

发表于 2022-6-18 22:15 来自手机 | 显示全部楼层
学习啊
回复 支持 反对

使用道具 举报

发表于 2022-6-21 18:20 来自手机 | 显示全部楼层
为什么要占用显存呢?运算速度才是关键指标,小显存占用是好事
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2024-3-29 05:38 , Processed in 0.152775 second(s), 20 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表