2018年7月23日 星期一

王銘琬九段的後阿發夠報告(29)


第十一回 回到戰場的Facebook

[加油田淵君!]

五月上旬,大名鼎鼎的臉書竟然將使用阿發夠零論文所做出來的圍棋AI的原始程式碼公開出來了。
這正式宣告兩年前在UEC電腦圍棋大賽決賽中和店長爭奪冠軍的黑森林(Dark 
Forest)程式的作者田淵棟先生回來了。

田淵棟先生來自於中國大陸,自然是姓田。不過因為他的名字剛好是淵棟的關係,對於日本人來說這
個姓氏一點都不奇怪(譯註:因為日本有田淵這個姓氏,就日本人來說,這個名字也可以看成姓田
淵、名為棟的人),所以在我心裡則是故意把他的名字念成了田淵(Tabuchi)君,因為這樣
很好玩。後來黑森林也退隱江湖,還我以為從此和田先生無緣再會了,沒想他卻在完全意料之外的地
方給大家驚奇一擊。

根據公開的資訊來看,這個新公開的軟體對上正火紅的LeelaZero(以下簡稱LZ)圍棋程
式,獲得了兩百戰全勝的好成績(後來重測一次,則是198勝2敗),又對上了韓國的主力職業棋
士也創下了十四戰全勝的紀錄。這個程式也公開了其中十二局和人類對戰的棋譜,然後預定接下來要
和LZ比個一千盤輸贏。(截稿為止前的消息)

這來來往往到底發生了甚麼事?可能會讓大家看不懂,以下會慢慢說明;不過,對我們來說影響最大
的,還是公開程式碼這件事。換句話說,這個軟體是不管是誰都能免費使用、愛怎麼用就怎麼用。這
也讓使用這套程式作為對局核心的商品,用很低廉的價格來服務想下棋的人。

至於被拿來證明臉書新程式很強大的LZ,其實也在進行一個很有趣的計劃。因為要使用阿發夠零的
方法來訓練AI,就得要非常多的硬體設備,一般會覺得不是大企業是辦不到的。不過LZ卻公開招
募願意幫忙的志工,利用志工們的個人電腦,來實施分散式的自我對戰訓練。這個成果也會拿出來公
開分享,讓每個人都能使用。

這個計劃是去年11月開始的。因為不學習任何人類棋譜,一開始的確是下出不知東南西北的棋,但
是到了今年四月,它的自我對戰局數已經來到了七百萬多局,而到了連人類職業棋士都下得贏的程度
了。

[只要想做就會做的大企業]

如果從阿發夠零是花了490萬局的自我對戰訓練才贏過阿發夠李世石版本來看,LZ花了七百萬局
大致上也是個合理的數字。後來阿發夠零又花了2900萬局的自我訓練而超越了阿發夠
Master版本(雖說其學習系統已經更強大了),因此未來如果志工們願意繼續支援分散式計算
的話,我們可以期待LZ終有一天可以到達超越阿發夠的程度。

在臉書圍棋程式的發表中,用來測試的LZ版本是4月25日的版本。其他的對局條件是完全不清
楚,所以只有等待後續進行一千局勝負時才知道了。

只不過,如果LZ的這個版本如果是和頂尖職業棋士具有同樣水準的話,那麼這個398勝2敗實在
也太恐怖了。臉書公司也不想在資料公開時提出一個不如股溝公司的東西,因此我們推斷這個程式可
說是具有阿發夠零同等以上的棋力吧。他們是從阿發夠零發表後短短半年的時間年內,就獲得了如此
強大的棋力,因此才敢拿出來發表。

田先生的團隊一方是沿襲著阿發夠零的手法,用來強化訓練的2000顆GPU,則是花了遠比兩、
三個月短的時間完成的。可見他們必定有省力、更有效率的做法。此外,用來對局的程式就不需要很
多很好的硬體設備,甚至連一個GPU都用不到。

至於LZ是靠著使用者們大家合力提供設備,花了許多時間才完成的,所以就被大企業的臉書公司給
搶先了。不過即便如此,臉書願意公開程式碼,還是很值得我們歡迎。從田先生公開的訊息中,我們
知道將技術給大家共享是該公司一貫以來的方針。

===



相關系列文章:

沒有留言:

張貼留言