弃子争先赢阿发狗应该易如反掌（阿发狗不活的情况下）

nazarene 发表于 2016-3-11 13:07

作为一种人工智能系统，AlphaGo拥有两个大脑，落子选择器（Move Picker）和棋局评估器（Position Evaluator）。这也基于两个深度神经网络，policy network与value network。二者极大地降低了需要考虑的搜索空间的复杂度，前者降低搜索的广度，后者降低搜索的深度，很像人脑在下围棋时凭直觉快速锁定策略的思维。
跟着老聂复了第二局，结合新华社对阿发狗的介绍，
个人感觉该算法弱点如下：落子选择器和棋局评估器几乎互相独立，具体行为模式如下。当阿发狗的棋有死活问题时，棋局评估器几乎未起作用，下法完全受落子选择器掌控。所以阿发狗会下出很损的招，单想着做活。而在阿发狗无死活问题时，棋局评估器才开始发生作用。那么，只要营造一些局面，就可以让阿发狗自废一半武功：比如弃子战术，比如不让阿发狗轻易做活（不是对杀，对杀，人的计算不如阿发狗，在自己不需要太多计算的情况下，尽量不让阿发狗作活），这时，棋手其实只是和阿发狗的落子选择器在对弈。而落子选择器几乎不进行形势判断。利用好，获胜概率相当大。

落子选择器的作用：基于死活的下一手。

棋局评估器的作用：不涉及死活的最佳下一手。

程序对二个算法的结合很不好（以后需要开发专门的结合算法）。

有效利用，职业选手应该能做到让现在的阿发狗每局必败。

nazarene 发表于 2016-3-12 16:28

第三局下完了，疑云重重了。李世石是否真的买了自己输?为阿发狗打广告?

页: [1]

飞扬围棋's Archiver

弃子争先赢阿发狗应该易如反掌（阿发狗不活的情况下）