2018年6月21日 星期四

王銘琬九段的後阿發夠報告(26)


第十回 再會了,DeepZenGo

[令人遺憾的退休]

可說是日本最強的圍棋AI---DeepZenGo(以下簡稱DZG)已於今年四月退休了。這則新聞不
僅是在日本,就連海外也都被盛大報導。DZG的前身Zen是從市售對局軟體引擎開始開發的,現
在最新的版本也可說是市售軟體中棋力最強的,所以長期在各國大受歡迎。

在中國,它也因為加入了可以和人類頂尖高手交手的世界圍棋賽而造成話題,所以知名度也非常高。
在圍棋中通常只要有下過棋自然就會有變成好友的感覺,所以對於世界各國的棋迷而言,一定會對於
有和世界頂尖高手作戰經驗的DZG要退休感到惋惜。

DZG在去年夏天,還獲得了圍棋AI的世界棋賽「第一屆世界電腦圍棋公開賽」的冠軍,這可以說
是日本久違的「圍棋世界棋賽冠軍」呢。一般的看法,應該是它接下來才要大展身手呢,怎麼會在此
時就要「退休」了呢?我想應該也有很多棋迷難以理解吧?其實就連我,在聽到這個消息的瞬間也是
嚇了一跳。不過考慮到現今的圍棋界狀況,就會覺得這是不得不如此的決定。

原本「DZG計畫」就是以打倒阿發夠為目標,集結了日本的多玩國公司、Zen、東大研究室等單
位發展起來的,正可說是象徵「後阿發夠時代」的計畫。一開始的判斷是在自我的技術中加入深度學
習的部分,如果「各取所長」,就能到達挑戰阿發夠的棋力。

這個預期,絕對不是憑空畫大餅。就像剛才所介紹過的世界賽冠軍,也是在和當時被認為具有與阿發
夠李世石版本同等棋力的「絕藝」對戰中,活用DZG自己的技術才勝出的,正好成為了這個計畫能
夠培育出高超棋力與其存在意義的最好證明。

[變化快速劇烈的AI世界]

只不過阿發夠也不會傻傻地停下來等待競爭者,它也陸陸續續地推出了Master、Zero等升
級版本。阿發夠這個目標本身就會持續成長,所以追逐阿發夠的意義也跟著發生變化。

在2016年對戰李世石的阿發夠,其硬體規模之大,不論是誰都會為之驚訝。因此圍棋軟體開發者
彼此都開玩笑說:「光要下一局的電費就會讓自己一個月的薪水飛掉」。即便如此,只要參考阿發夠
在之前發表的論文,在目前的程式中加入深度學習的技術,就可以讓棋力快速進步。

深度學習和以往的技術在方向性上雖然不同,但只要加以克服,就可以在很多地方花上各自的心思將
其變為棋力進步的長處。換句話說,就是要考量「如何在既有的技術上,導入以深度學習為首的種種
新技術?」。這個部分就連阿發夠自己也一樣沒甚麼不同。就算其他的程式在硬體規格上可能會有很
大的差異,基本上這些圍棋AI都還是等於在「同樣的基礎」中比高下。

然而,到了去年十月「阿發夠Zero論文」發表之後,就將這個狀況完全改變了。Zero的論文
所提示的方法非常簡潔,但是需要龐大的計算量。其計算量大到如果DZG也要去做同樣的事情的
話,可能要花上數百年才能達到的程度。

這樣的方法和阿發夠李世石版本不同,讓以往累積的圍棋AI技術變成幾乎毫無用處。而且使用這樣
的方法所鍛鍊出來的棋力,還能到達以往完全無法想像的超高程度。

[升級也要靠財力才行]

至於阿發夠Zero到底造成了怎樣的狀況?只要看看去年12月舉行的AI龍星2017比賽就知
道了。股價總值到達世界前六大的中國騰訊公司所開發的「絕藝」,在Zero發表後僅僅兩個月之
後,使用了和Zero論文同樣的方法升級成功,一口氣將棋力提升了二子之多。

其實在這次升級之前的「絕藝」就已經比DZG更加穩定了,而被認為具有僅次於Master的強
大棋力。當然真正的高下還是要實際下過了才知道,但是其他的圍棋AI要勝過棋力增強二子的絕藝
無疑是非常困難的事情。

大家都知道,圍棋的棋力只要到了越高段的程度,想要進步就越加困難。就算是AI,到了DZG的
水準,程式上的小修改往往也只能讓棋力提升一點點而已。所以突然就進步了二子,等於是異次元的
跳升了。

===



相關系列文章:

沒有留言:

張貼留言