nazarene 发表于 2016-3-11 13:07

弃子争先赢阿发狗应该易如反掌(阿发狗不活的情况下)

作为一种人工智能系统,AlphaGo拥有两个大脑,落子选择器(Move Picker)和棋局评估器(Position Evaluator)。这也基于两个深度神经网络,policy network与value network。二者极大地降低了需要考虑的搜索空间的复杂度,前者降低搜索的广度,后者降低搜索的深度,很像人脑在下围棋时凭直觉快速锁定策略的思维。
跟着老聂复了第二局,结合新华社对阿发狗的介绍,
个人感觉该算法弱点如下:落子选择器和棋局评估器几乎互相独立,具体行为模式如下。当阿发狗的棋有死活问题时,棋局评估器几乎未起作用,下法完全受落子选择器掌控。所以阿发狗会下出很损的招,单想着做活。而在阿发狗无死活问题时,棋局评估器才开始发生作用。那么,只要营造一些局面,就可以让阿发狗自废一半武功:比如弃子战术,比如不让阿发狗轻易做活(不是对杀,对杀,人的计算不如阿发狗,在自己不需要太多计算的情况下,尽量不让阿发狗作活),这时,棋手其实只是和阿发狗的落子选择器在对弈。而落子选择器几乎不进行形势判断。利用好,获胜概率相当大。

落子选择器的作用:基于死活的下一手。

棋局评估器的作用:不涉及死活的最佳下一手。

程序对二个算法的结合很不好(以后需要开发专门的结合算法)。

有效利用,职业选手应该能做到让现在的阿发狗每局必败。

nazarene 发表于 2016-3-12 16:28

第三局下完了,疑云重重了。李世石是否真的买了自己输?为阿发狗打广告?
页: [1]
查看完整版本: 弃子争先赢阿发狗应该易如反掌(阿发狗不活的情况下)