飞扬围棋

标题: 请问Tesla A100下围棋强吗 [打印本页]

作者: liuyifei2020 时间: 2020-12-21 11:46
标题: 请问Tesla A100下围棋强吗
本人小白，想装一台4路A100，请问A100在性能上如何？在A100上加载里拉围棋，可以碾压3090TI吗？求大神回答。

作者: liuyifei2020 时间: 2020-12-21 12:33
这个A100支持强权重吗？

作者: amiok 时间: 2020-12-21 12:42
A100 是计算卡，主要是 fp64（双精）性能强，可用于训练 AI 权重，价格超级贵，给企业用的，个人一般用不起。

下棋，只用到 fp32（单精），甚至只需 fp16（半精），或 Tensor Core 加速，用已训练好的权重进行推理，3090显卡缩减了fp64功能，性价比高太多，棋力不弱于 a100。

作者: liuyifei2020 时间: 2020-12-21 12:47

amiok 发表于 2020-12-21 12:42
A100 是计算卡，主要是 fp64（双精）性能强，可用于训练 AI 权重，价格超级贵，给企业用的，个人一般用不 ...

本人小白，不明白啥是训练权重，您能解释一下吗？

作者: liuyifei2020 时间: 2020-12-21 12:49
20B是啥意思，为啥说20B，比40B弱，不只是数字上差20那么简单吧？

作者: amiok 时间: 2020-12-21 13:09
本帖最后由 amiok 于 2020-12-21 13:22 编辑

训练权重，就是让机器学习高水平棋谱，提高权重的棋力水平。高水平权重，是要经过长时间学习的。还要经过比赛，优胜劣汰。大浪淘沙，最后留下最优秀的。与人类的学习过程非常相似。

高水平权重，自对弈，产生高质量棋谱；
高水平棋谱，训练出新权重，与原权重比赛，获胜，得到更高水平的新权重；
迭代，重复上述过程，水平越来越高，超越人类，接近上帝。

权重，就是机器学习后的大脑。40块权重，非常大的大脑，训练有素，所以水平非常高，棋力非常高，但运算比较慢。20块权重，中等大小的大脑，虽然棋力不是最高，但体积小，运算速度快。15块权重，超过人类最高水平，体积更小，速度更快。

星阵围棋用的是 50块权重打败了 KataGo 40块权重。

作者: liuyifei2020 时间: 2020-12-21 13:34

amiok 发表于 2020-12-21 13:09
训练权重，就是让机器学习高水平棋谱，提高权重的棋力水平。高水平权重，是要经过长时间学习的。还要经过 ...

谢谢🙏，涨知识了。

作者: liuyifei2020 时间: 2020-12-21 13:40

amiok 发表于 2020-12-21 13:09
训练权重，就是让机器学习高水平棋谱，提高权重的棋力水平。高水平权重，是要经过长时间学习的。还要经过 ...

那请问40B的权重配什么样的显卡才能把它的水平最大化呢？

作者: amiok 时间: 2020-12-21 14:30
本帖最后由 amiok 于 2020-12-21 17:17 编辑

4路A100，京东查了一下，报价33万元多。如果只用来下棋，太奢侈了。如果用来训练AI，又远远不够。KataGo 用了 46块 V100，练了半年，光电费也不是一个小数目。当年看 AlphaGo 记录片，放大仔细看他们开发的屏幕，发现可用 GPU 竟有 23万块，惊掉下巴，印象深刻。

下棋，
RX 6800XT 足够了。台积电 7nm 工艺，计算性能 FP32 20.74 TFlops，功耗 300瓦，价格 6200元。（性价比高，目前价格虚高）

RTX 3090，三星 8nm 工艺（10nm 二代），计算性能 FP32 35.7 TFlops，功耗 350瓦，价格 1.5万元。（民用顶级，目前价格虚高）

电子产品，更新换代太快。硬件新产品计算性能每年能番一倍，10年差了 1000倍，20年能差 100万倍。

再加上软件的优化，新技术层出不穷。用不着发烧，新产品一年后就落伍了。再烧，也烧不过巨头们（如，谷歌、亚马逊、阿里、腾讯，……）。

我自己，2018年买的 Vega 56，现在还不亦乐乎，感觉足够了。14nm工艺，计算性能 FP32 10.5 TFlops，功耗 250瓦。

作者: amiok 时间: 2020-12-21 15:30
本帖最后由 amiok 于 2020-12-21 17:06 编辑

6块权重，Elo 等级分 3000，业余6段水平

10块权重，Elo 等级分 3600，职业棋手水平

15块权重，Elo 等级分 4200，超越人类水平，柯洁 4000 左右

20块权重，Elo 等级分 4700，让人类2子水平

40块权重，Elo 等级分 5100，让人类3子水平

权重的块数，就是我们学棋中所遇到所谓的瓶颈，大多数人，无论多用功，只能达到业余5段水平，也就是6块权重，再要提高会非常非常困难。除非，从小就深度接触围棋。所以，现在的职业棋手，都是放弃了学业，从小开始一直下棋，童子功很重要！小朋友的学习能力，绝对不容小觑，从语言学习能力上，越小越纯正，越没有口音，能充分证明。还需要天赋，即大脑很敏感，他们也会遇到瓶颈，需要冥思苦想，多天后突然开窍了，这就是突破瓶颈了，可能就是神经网络的块数升级了。估计达到 15块权重，已到了人类生理极限。棋手都很敏感，也很脆弱，容易抑郁，可能是神经连接太多，发生了短路，就想不开了。发现，棋手大多爱喝酒，压力太大，需要适当释放，缓解压力。有研究说，精神分裂症患者，其家属成员的成就普遍很高，说明神经网络比较敏感，容易连接，也容易搭错，所谓的走火入魔。

围棋确实是开发智力的好工具。东亚三国，都有喜爱围棋的传统，智商在地球上最高。也许是有关系的。

以前，看围棋，如同看天书，根本看不懂，面对同一局面，高手之间的观点也往往会不同，谁知道电视上的解说对不对。现在好了，有了真正的绝顶高手，帮我们爱好者分析棋局，优劣立判。但同时，也失去了围棋玄之又玄，山外有山，天外有天的魅力。

围棋 AI，使我们对学习、智力、智慧、大脑，有了新的认识。是人类技术革命重大突破的里程碑。最重要的是突破了智慧不可言传，只可意会框框。现在可以很方便地传播、传承了。人人可以站在绝顶高手的肩膀上看世界。

作者: 飘弈女孩 时间: 2020-12-21 18:32

amiok 发表于 2020-12-21 15:30
6块权重，Elo 等级分 3000，业余6段水平

10块权重，Elo 等级分 3600，职业棋手水平

通俗易懂的解释，非常好！感谢！

作者: liuyifei2020 时间: 2020-12-21 19:03

amiok 发表于 2020-12-21 15:30
6块权重，Elo 等级分 3000，业余6段水平

10块权重，Elo 等级分 3600，职业棋手水平

多谢解答，请问卡塔狗40块权重的哪里可以下载？40块权重的卡塔狗在RX 6800 XT上能达到大概什么水准？

作者: amiok 时间: 2020-12-21 20:06
本帖最后由 amiok 于 2020-12-21 20:50 编辑

KataGo 权重，最强：g170-b40c256x2-s5095420928-d1229425124.bin.gz

下载地址：
https://github.com/lightvector/KataGo/releases/tag/v1.4.5

主页：
https://github.com/lightvector/KataGo

RX 6800XT，最近刚出，我没用过，据介绍性能比 RTX 2080Ti 高15%，RTX 2080Ti KataGo 40B 1000visit/s。2秒下一步棋，Elo 5100分，水平非常高了。
开源程序，让我们爱好者，能一窥神奇的 AI 运作机制，能一起分享学习、训练、成长的过程。感谢 GCP、David Wu，及众多的开发者，无私的奉献。

作者: liuyifei2020 时间: 2020-12-21 20:11

amiok 发表于 2020-12-21 20:06
KataGo 权重，最强：g170-b40c256x2-s5095420928-d1229425124.bin.gz

下载地址：

谢谢了，我仔细研究一下。

作者: hred9D 时间: 2020-12-21 20:16
起步的2060S，运行40B的权重，学习，欣赏，教学围棋，足够了
职业棋手都赢不了2060S
A100，可以用来下棋，相同权重，肯定可以赢3090，但是也仅是在机器之间对弈，没有什么意思，意义仅仅在于测试围棋权重和程序之用。
因为2060S一样可以解释人类可以理解的棋理和下法。普通人，买A100没有意义。当然土豪除外

作者: liuyifei2020 时间: 2020-12-21 20:36

hred9D 发表于 2020-12-21 20:16
起步的2060S，运行40B的权重，学习，欣赏，教学围棋，足够了
职业棋手都赢不了2060S
A100，可以用来下棋 ...

明白了，谢谢，关键是我的这个主板已经5年了，有点老了，不一定支持新的显卡，要换可能得一起还，比较麻烦。

作者: amiok 时间: 2020-12-22 07:42
本帖最后由 amiok 于 2020-12-22 14:39 编辑

老机器，你需要注意，

电源够不够，一般是不够的，显卡的功耗很高，以前的电源是配不上的。普通电源，价格便宜，但性能很差，电源转换效率不高。金牌电源效率80%，白金电源效率90%。因为功率高，所以效率很重要。即使是金牌，500瓦的电源，不但要浪费100瓦，还产生大量的热量。

再一个，机箱散热。300瓦显卡，再加上CPU等，整机功耗一定在500瓦以上，2个小时1度电。相当于一个取暖器或电饭煲，机器散热很重要，否则，用不了多久，就烧坏了。老机器只能裸机使用，还要用空调降低室温。

所以，你只能选择过时的显卡，还只能选不太强的。如 RX 580，100瓦功率。速度慢一点，30秒一步棋，也能达到 5100 Elo。看棋、学棋够用了，好处是，价格便宜，二手只要 500~600元。

作者: liuyifei2020 时间: 2020-12-22 11:17

amiok 发表于 2020-12-22 07:42
老机器，你需要注意，

电源够不够，一般是不够的，显卡的功耗很高，以前的电源是配不上的。普通电源，价 ...

明白了，谢谢

作者: liuyifei2020 时间: 2020-12-22 11:45

amiok 发表于 2020-12-22 07:42
老机器，你需要注意，

电源够不够，一般是不够的，显卡的功耗很高，以前的电源是配不上的。普通电源，价 ...

刚才看了一下我现在的显卡，是GTX 750 TI 2GB的，您看这个下棋如何？

作者: amiok 时间: 2020-12-22 12:47
本帖最后由 amiok 于 2020-12-22 13:01 编辑

GTX 750 Ti，2014年产品，28nm，FP32 1.3TFlops，640个流处理器、18.3亿个晶体管，功耗75W

相当弱，计算能力与 3090 差了30倍，实际可能还不止。用 40块权重肯定有点累。但跑 15块权重，应该没问题，你可以试下，棋力可达 4200分，比人类顶尖还是要强大的。
下棋推荐 KaTrain，他自带 KataGo 15B权重，可设定棋力、棋风。
分析推荐 Lizzie，与 KataGo 配合默契。

A100，有 542亿晶体管，8nm。这就是技术的进步的力量。也反映在，现在美国一定要卡住中国，不能让中国在先进技术上突破。中国现在自主制造只有 28nm 的能力，就是你现在在用的显卡的水平。差距确实有点大。

作者: liuyifei2020 时间: 2020-12-22 13:14
本帖最后由 liuyifei2020 于 2020-12-22 13:20 编辑

amiok 发表于 2020-12-22 12:47
GTX 750 Ti，2014年产品，28nm，FP32 1.3TFlops，640个流处理器、18.3亿个晶体管，功耗75W

相当弱，计 ...

求自带15权重卡塔狗的katrain下载地址，我试试看棋力如何

作者: liuyifei2020 时间: 2020-12-22 13:27

amiok 发表于 2020-12-22 12:47
GTX 750 Ti，2014年产品，28nm，FP32 1.3TFlops，640个流处理器、18.3亿个晶体管，功耗75W

相当弱，计 ...

B站的那个下载地址已经快半年了，权重是不是已经更新了啊？

作者: amiok 时间: 2020-12-22 13:44
本帖最后由 amiok 于 2020-12-22 14:33 编辑

KataGo 半年前已停止训练了。它的贡献，主要在优化，用少得多的资源，取得了非凡的效果，而且添加了非常实用的功能。
AlphaGo 两年前就终止项目了。它的贡献无与伦比，具有创造性，启发性，取得了突破性成果，2篇论文在顶级杂志发表，让世界为之一震，掀起 AI 巨浪。足以载入人类进步的史册。公司初创时，李嘉诚旗下基金投资入股。公司发展时，谷歌收购助其腾飞。比赛时，李嘉诚亲临现场，谷歌老板也现身。伯乐啊！

星阵、绝艺，可能还在继续，是商业的，闭源的，不公开的，与大众无关。

围棋，毕竟是小道，是智力游戏，是消遣的东西。棋力再高，意义和价值都不大，人类都已经看不懂了，让人类3子，现有的智慧，已可与天仙媲美。

作者: SmileFox 时间: 2020-12-22 16:42

liuyifei2020 发表于 2020-12-22 13:14
求自带15权重卡塔狗的katrain下载地址，我试试看棋力如何

Release v1.7: The big analysis and sgf features update · sanderland/katrain · GitHub

作者: bycn 时间: 2020-12-23 11:35
扫盲贴，收藏了，感谢amiok

作者: 爱情隔夜茶 时间: 2020-12-23 16:37
大神专业但是自己下棋复盘本人亲测 kata+cpu足够了所有580-1060以上显卡都不是任何一个业余或者普通职业所能感觉出来的什么20.30.vb100 都是浮云与我们无关

作者: 爱情隔夜茶 时间: 2020-12-23 16:39
实在不好意思就选个1060吧足而又足我换30是想体验一下那个张量中心

作者: 时间小虫 时间: 2021-2-2 11:55

amiok 发表于 2020-12-21 15:30
6块权重，Elo 等级分 3000，业余6段水平

10块权重，Elo 等级分 3600，职业棋手水平

这个块是什么意思？显卡的块数还是B的意思？

作者: amiok 时间: 2021-2-3 07:45
本帖最后由 amiok 于 2021-2-3 08:43 编辑

块就是 B，即 Block，残差神经网络（ResNet）的深度单位，1块相当于有2层，其中一层是差分，放大细节差异，便于神经网络训练稳定收敛，所以残差网络可以堆得更深。AlphaGo Master 使用 20块残差网络，后来用 40块。AlphaGo Zero 则直接用 40块。

卷积神经网络（CNN）的深度单位是层，层数多了，神经网络很难训练，AlphaGo Lee 只有 13层，下棋有明显的盲点，被李世石抓住过一盘，赛前樊麾已经发现这个缺陷了。

作者: dazuliu 时间: 2021-2-12 11:32

amiok 发表于 2020-12-21 14:30
4路A100，京东查了一下，报价33万元多。如果只用来下棋，太奢侈了。如果用来训练AI，又远远不够。KataGo 用 ...

请教一下，很多人说A卡跑AI 不好，实际使用有问题吗

作者: amiok 时间: 2021-2-15 18:56
A 卡，使用 OpenCL 加速，不如 N 卡 CUDA 快。但差距不大。

A 卡 Navi核心的驱动 OpenCL 曾经有问题，2020年已修复驱动。围棋程序 Leela Zero 和 KataGo 的 OpenCL 版，使用没有问题。之前的旧核心，如 Vega 等，一直没问题。

作者: leixz010 时间: 2023-11-19 13:02
感谢

作者: 厚渊 时间: 2023-11-19 19:24
对于业余棋手自身训练来说，不需要很高端显卡跑太大的计算量。主要是因为实战中没有时间做太多的计算，有些招法AI算出来了咱们也下不出来。

作者: 发扬论学qi 时间: 2023-11-28 22:04
如果是自己下棋复盘分析用那太浪费了，如果是想跟其它AI账号网上对弈或者跟人下让子棋，那还差不多

羡慕楼主是土豪

小白居然这么舍得花钱，我也想有高配电脑啊

作者: Thaldn 时间: 2023-11-29 06:52
太碾压了

作者: dracula86 时间: 2024-2-6 21:09
A卡 6800xt开始就拥有gfx1030核心了。我个人使用的是6900xt，opencl使用起来还是不错的，不过以前问过一个做围棋游戏的人，据说矿潮时期最有性价比的是3080Ti。不知是此人完全不关注A卡，还是cuda核心确实残暴。
另：有没有大佬有新一代线程撕裂者之类的残暴型cpu？amd在cpu上使用的ai技术越来越多，8700g的核显都有npu，不知道以后能不能摆脱gpu算力的桎梏。咱用cpu也能输出高算力。

欢迎光临飞扬围棋 (http://flygo.net/bbs/)