飞扬围棋论坛

 找回密码
 注册
搜索
查看: 7127|回复: 2

人工智能如何用来下围棋

[复制链接]
发表于 2019-1-10 16:04 | 显示全部楼层 |阅读模式
本帖最后由 jiuxin2018 于 2019-1-10 16:05 编辑

围棋(AlphaGo)虽然只是由黑白两色的棋子跟简单的游戏规则所组成,但玩法却千变万化,因此被公认为最困难的棋类游戏之一。相较于其他的棋类游戏,围棋的每一步棋可以选择的路径更多,举西洋棋为例,每步棋仅有20种步法,而围棋每步棋却高达200种,棋局的可能变化数目比全宇宙所有物质的原子总数(十的八十次方)还要多,即使出动全世界的计算机同时全力运作一百万年,这样运算能力也还不足以运算出所有棋局的变化。因此,对于计算机来说,围棋是很难破解的关卡,而打败职业棋士一直是人工智能的一大挑战。

如果你问一名职业棋士为何走那一步棋,有时他会回答:「因为感觉是对的。」然而,这种抽象的感觉,对于需要严谨逻辑推论的计算机运算来说却有如天书般的存在。一直到了机器学习技术的快速发展,人类才得以赋予计算机这份「直觉」。机器学习的原理就是仿造人脑而建立的神经元数学模型,并利用一层层链接的结构来仿真人脑,造就一个具有学习跟归纳能力的类神经架构。这个仿生结构的概念已经存在很久,只是到近代硬件运算能力爆炸成长后,我们才得以实现这个需要大量平行运算的架构。回首过去人工智能运算的发展史,1997年IBM打造的超级计算机深蓝(Deep Blue)击败了俄罗斯籍世界西洋棋棋王加里·基莫维奇·卡斯珀洛夫(Garry Kimovich Kasparov),深蓝的作战策略主要是透过计算接下来的12步所有可能发生的棋局来击败对手。然而,人工智能-「AlphaGo」最初设计的目标是仿效人类的直觉,而不再是利用深蓝计算机所采用的暴力解题法透过强大的计算能力来计算所有可能的棋局以打败人类。

AlphaGo走棋的方式

AlphaGo下棋主要分成三个步骤,第一步会扫描棋子摆放情况并从中找出可行的落点,第二步从每个可行的落点建构出预测棋步的树形图,第三步在对每个树状的分支计算胜率并找出最大获胜机率的落点。在AlphaGo挑战完世界棋王之后,接着又历经了几次升级并成为了最新版的-「AlphaGo Zero」,这个系统则不再需要透过人类进行训练,也不再倚靠人类的知识,即为它不再需要人类的帮忙与训练,并且也已不再仅局限于围棋,而是可以在各项棋类活动、竞赛中大展身手。这其实也意谓着:为未来的人工智能将有无限可能的发展。


令人好奇的是,难道人类真的无法打败这台超级计算机吗?即使AlphaGo在2016年对战18次世界冠军李世乭的时候已经可以预测接下来的50步棋,但是在第四战的时候还是输给了职业棋士,难道机器也会出错吗?其实当下AlphaGo认为李世乭走那一步被誉为神之一手的机率只有万分之一,而正是那一步棋让AlphaGo接下来所有棋步走向崩溃,由此可知,即使AlphaGo与自己对弈了数万局棋,仍然还是有些盲区存在。不过在Deepmind团队持续升级AlphaGo之后,2017年AlphaGo Master对战中国世界冠军柯洁已经毫无悬念的取得3:0胜利了。

在接下来的文章中,我们将针对AlphaGo的演进以及其所拥有的能力及技术作介绍。在人工智能技术日益发展并迈向成熟之路的同时,哪些部分仍有不足待解决之处,又有哪些道德以及责任需要被注意与探讨的,都是人类在面对全新的智慧生活环境时所需深入思考的。透过此系列介绍,让读者有更多层次的思考角度。

回复

使用道具 举报

发表于 2019-1-11 07:43 | 显示全部楼层
先顶一个
回复 支持 反对

使用道具 举报

发表于 2019-1-13 10:05 | 显示全部楼层
策略算法,价值算法,才真正使围棋AI达到高水平,否则传统算法导致海量运算,计算机无法承受!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2024-3-29 02:41 , Processed in 0.140693 second(s), 19 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表