2017年11月4日 星期六

加藤英樹談圍棋AI的過去.現在與未來(4)



DZG的特長


加藤:
其實圍棋這個遊戲,手順是非常重要的。好比說像下圖的攻殺,不要馬上A打,反而要先從根本的B位粘住,然後再下A打,才是正確的手順。然而在模擬時,如果不花點心思、不好好在程式上寫些東西,電腦就會很常出現上述直接A打的問題。其他像是反提或是接不歸等型態,也必須加入檢查用的程式。像這樣的檢查工夫,在Zen的時代(未加入VN、PN的時代)我們就加了非常多,這就是Zen強大的地方。也是靠著這些工夫,才能強到可以在被武宮正樹九段讓四子還能獲勝的水準。不過,到了這個程度,我們就撞牆了,從此進入了冰河時期。甚至到了讓尾島先生想停止開發的程度。




星合:
也就是開發的動機不見了啊。

加藤:
就在此時,阿發夠出現了。

星合:
這就和尾島先生讀了阿發夠論文之後想去拜託多玩國公司的事情連了起來了呢。

大橋:
將蒙地卡羅搜尋樹、PN、VN結合起來的DZG在接近戰上也還是非常強,應該也是前述的功夫發揮了作用的關係吧。

避戰的阿發夠

星合:
這樣我多少理解電腦圍棋的架構了。但與DZG相比,阿發夠的特徵又是甚麼呢?

加藤:
如果仔細咀嚼股溝公司的論文的話,就知道這個程式是用絕對不會往自己不擅長的地方走的方向來寫成的。

星合:
所以阿發夠也是有不擅長的地方?

加藤:
具體來說,就是因為一手之差而導致勝負翻轉的局面。

星合:
意思是戰鬥或攻殺嗎?

加藤:
並不是指全局而是可能會造成「翻轉勝負」的攻殺或戰鬥。像這樣的局面,阿發夠會評價成「不利的局面」,而阿發夠的VN就是根據這個原則來做成的。這也許會被看成是不敢正面對決的狡猾做法,但其實人類本身也是會用避開自己不擅長的局面而想轉往自己擅長的局面的方式來下呢。

星合:
原來如此。雖然它是避開不擅長的攻殺或戰鬥,但結果上卻是用人類視角來看,變成了具有高度大局觀的下法呢。我一直有AI具備了強大細算能力的印象,其實是根本相反的啊。

加藤:
圍棋AI總是用全局的角度來檢視,其實是無法像人類那樣集中在某個局部來深入細算的。

大橋:
人類是一面俯視全局、一面根據需要進行局部的細算,這其實是AI還沒辦法做到的。

加藤:
像這種靈活切換大局與局部的能力,不僅是圍棋而已,其實也是所有領域AI設計的課題。

如果DZG和阿發夠一戰的話...?

加藤:
AI和人類下棋時,是利用VN盡量在佈局階段領先,然後一路維持優勢到底的下法。然而在圍棋AI程式對戰時,由於彼此的佈局都很強,就很難在一開始拉開差距。因此,就變成了中盤的戰鬥力才是勝負的關鍵。在世界電腦圍棋公開賽時,因為DZG在預賽中分別輸給了CGI與絕藝的關係,所以在決賽時故意調降了VN的比重,而把模擬的比重提升而使中盤戰鬥力加強起來。因為一如前述,DZG在模擬中的戰鬥能力上花了很多心血,這也是我們長期開發累積出來的成果。最近才開始開發的圍棋AI並沒有這一塊,所以就算是把VN比重下調,也無法讓戰鬥力變強。

星合:
那阿發夠與DZG到底何者比較強?

加藤:
這就不知道了。就像前面說過的一樣,能勝過人類並不代表能勝過其他圍棋AI。如果將CGI、絕藝一起加進來下循環賽的話,阿發夠說不定也會輸掉。在這方面,因為DZG在中盤的戰鬥力做的不錯,在這方面上有一定的好處。所以關鍵就在於在佈局階段會有多少差距了。

===




相關系列文章:

沒有留言:

張貼留言