飞扬围棋

 找回密码
 注册
搜索
查看: 5539|回复: 3
打印 上一主题 下一主题

新AlphaGo赢过旧版:不仅会自学 且只需4个TPU

[复制链接]
跳转到指定楼层
1#
发表于 2017-10-22 15:52 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
AlphaGo Zero出世

  新浪科技讯 北京时间10月19日早间消息,谷歌旗下人工智能研究部门DeepMind发布了新版AlphaGo软件,它可以完全靠自己学习围棋。

  这款名为AlphaGo Zero的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在不断训练的过程中,这套系统开始靠自己的能力学会围棋中的一些高级概念。

       经过3天的训练后,这套系统已经可以击败AlphaGo Lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。经过40天训练后,它总计运行了大约2900万次自我对弈,使得AlphaGo Zero得以击败AlphaGo Master(今年早些时候击败世界冠军柯洁的系统),比分为89比11。

  结果表明,具体到不同技术的效果,人工智能在这一领域仍有很多学习的空间。AlphaGo Master使用了很多与AlphaGo Zero相同的开发技术,但它需要首先利用人类的数据进行训练,随后才切换成自我对弈。

  值得注意的是,虽然AlphaGo Zero在几周的训练期间学会了一些关键概念,但该系统学习的方法与人类有所不同。另外,AlphaGo Zero也比前几代系统更加节能,AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要使用一台配有4个TPU的机器即可。


回复

使用道具 举报

头像被屏蔽
2#
发表于 2017-10-22 15:58 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

3#
发表于 2017-10-22 22:36 | 只看该作者
ecolp 发表于 2017-10-22 15:58
最后手机随便下个对弈软件,棋力不输给职业的,比赛的魅力和刺激会差很多

按硬件发展速度,迟早的事
回复 支持 反对

使用道具 举报

4#
发表于 2017-10-23 14:04 | 只看该作者
应该是算法和策略上的巨大进步。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2024-11-17 16:18 , Processed in 0.134883 second(s), 19 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表