網頁

2018年6月22日 星期五

王銘琬九段的後阿發夠報告(27)


阿發夠Zero使用了股溝公司自豪、為了深度學習專用的處理器TPU五千顆,花了四十天才到達
了那樣驚人的棋力。據說這四十天所花掉的電費可是高達數十億日圓呢。

至於絕藝沒有TPU可用,所以據說可能使用了一般市售的GPU十萬顆。其價值據說粗估起來也達
到了一百億日圓的程度。這些數字都是在說明了毫不猶豫、直衝目標時就需要花上這麼多時間與金
錢。

換句話說,僅僅花了兩個月就能使用阿發夠Zero的方式完成升級,就是需要難以想像的資金與技
術力,可以說是僅有像騰訊這樣的巨大企業才辦得到的玩意了。

也想要進行同樣升級的台灣強隊CGI,現在就為了資金與設備的不足,而無法達到期盼的目標。也
就是說,現在想要做出可能成為世界第一的圍棋AI的話,只有以下兩條路可以走了:

1.超過百億日圓的資金,或者能夠籌備到具有同樣價值的設備,來進行阿發夠Zero式的升級。

2.發明出超越阿發夠Zero的強化系統。

此外,就算具備了足夠的資金,花了大錢做出和阿發夠Zero同等水準的東西,到底有甚麼意義?
也是很需要考慮的問題。

[需要改變圍棋AI開發想法的時期]

阿發夠Zero因為TPU要用在進行其他預定目的開發的關係,所以發展到超越Master版本
時就停止訓練了。看起來,如果繼續讓它訓練下去的話,還有繼續進步的餘地。因為絕藝在AI龍星
戰登場時,對上自己兩週前的版本竟然又有高達七成的勝率(譯註:棋力相差一先),就說明了一
切。

圍棋AI雖然有繼續強化下去的空間,但也會出現等於是在比資金雄厚的副作用。即便對於股溝或是
騰訊來說,這也不是甚麼值得開心的事情。總之圍棋AI的發展狀況,比起阿發夠李世石版本時的變
化更加巨大了。

在這樣的狀況下,DZG退休是件令人能夠認同的事情。因為阿發夠Zero的關係,大家就需要重
新檢視一下圍棋的棋力強大到底是怎麼一回事了。換句話說,必須要從只讓圍棋AI走棋力增強的方
向轉往具有更加寬廣視野的目標才行了。

[最後之戰]

舉辦作為DZG退休典禮儀式的「圍棋電王戰大結局(Final)」,也等於是給DZG復仇之戰
機會的這個比賽,找來了過去擊敗過DZG的中國羋昱廷九段、韓國朴廷桓九段與日本的趙治勳名譽
名人來與之分別進行三局棋。

就這個時間點的內容來看,DZG應該是要獲得三連勝才對的,但是第一戰還是被羋昱廷九段砍下,
結果僅以二勝一敗收場。在第一局中,果然是因為得意(?)的攻殺誤判而成為敗因,但是在第三局
中卻發揮了本性中的強烈攻擊威力而輕鬆獲勝。就結果來看,這還是很符合DZG風格的退休系列賽
呢。

1圖是最終局的局面,DZG持黑。對於白1夾擊,黑2、4這種強硬分斷的手法是至今為止常常會
看成無理的下法,但此際黑6、8繼續張網強攻也是非常嚴厲。DZG是從店長時代以來就具有強大
的殺力,但在最後一局中還下出這種走法,就只能說是「江山易改本性難移」了。不過,這樣的下法
的確很有參考價值。

1圖 DZG(黑) vs 趙治勳名譽名人


其他令我印象深刻的地方反而是在意外有點無聊之處。比如說2圖是第一局棋,DZG持白。白1後
的白3打,對人類來說是沒有意義的棋,反而只是浪費掉一個重要的劫材。除此之外,DZG也在別
的地方下出了類似的棋。如果只看損失劫材這件事的話是有點無聊,但卻能令人想起去年同樣對上羋
昱廷之戰的情景(DZG持白)。


2圖 羋昱廷vsDZG(黑)


至於3圖的白2就不只是損失劫材而已了,而且還失去了白A先手一目的官子(接下來有白B撲的手
段),實質上就是損失一目。由於這個局面非常細微,因此白2幾乎成為了敗著。

3圖 幾乎要了命的白2


這讓我注意到,在圍棋AI領先群中,DZG這種棋是下最多的。雖然今後希望它能致力於消除這個
問題上,但是這種棋可能也是來自於它那吸引人的強大攻擊力上,可說是互為表裡的問題,這也正是
圍棋AI困難且有趣之處。

以往的DZG是不得不傾注全力於增強棋力之上,但回覆成店長(Zen)之後,卻可以想改甚麼就
改甚麼了。我想維持現在的棋力強度就好,然後朝向對於人類來說下得更自然的方向來開發,說不定
也是一個不錯的選擇呢。

===



相關系列文章:

沒有留言:

張貼留言