2018年1月2日 星期二

王銘琬九段的後阿發夠報告(15)



[人類並沒有輸]

雖然我不太想太深入討論阿發夠零的論文,但為了解說阿發夠零的秘密,還是不得不說明以下的內容。

阿發夠零向全世界展現最深的印象,就是「沒有教學的學習打贏了有教學的學習」,但我們不得不說實
情是否如此,是相當微妙的。尤其這篇論文最受注目、也最受到媒體大幅報導的地方,就是阿發夠零僅
花了三天就用一百勝零敗痛宰阿發夠李世石版本、花了四十天後又用89勝11敗的成績打敗的阿發夠
Master版本,成績相當輝煌。

然而,這兩項對決中,阿發夠零和對手並不是使用「相同的條件」。圍棋AI之所以可以超越人類,是
靠著一層層神經網路(NN)的深度學習技術。也因此,NN的「層數」越多,學習效果就越好。

在阿發夠對上李世石先生之時,使用的神經網路是十三層,當時很多人已經覺得這「很了不起!」了,
但現在的神經網路已經可以超過了一百層了。因為和李世石對戰版本相比,阿發夠零的NN層數是標記
成「20個區塊(Block)」。這種標記或許有點問題,實際上這個「20個區塊」大約是相當於40
層的神經網路。

換句話說,第一項的對決中,其實是40層和13層相比,獲勝可以說是理所當然的。至於和
Master版的對決,則是標記成「40個區塊(Block)」,也就是相當於80層的神經網路的版
本。由於Master是「20個區塊(Block)」,所以第二項的對決也是「不同階級的對戰」。

因此,除了很期待能看到學習過人類棋譜的Master能同樣升級到80層神經網路(「40個區
塊(Block)」)與阿發夠零進行對決以外,還有其他值得注目之處。就是論文中提到了讓
Master和李世石版本時期的另一個版本對戰過。因為論文中這個對戰,是同樣以40層(20
個區塊)的方式來進行,這樣就很顯而易懂。

那麼為何論文中沒有另外再進行80層的Master與80層的阿發夠零進行對決呢?就常理推測,
就是阿發夠零在40層的狀況下雖然能贏過李世石版本,卻贏不了同樣是40層神經網路的
Master版本。換句話說,大家不要像柯潔一樣難過,因為「有學過人類棋譜」的AI版本和「
沒有學習過棋譜」的AI版本之40層神經網路對決,是沒有輸掉的。這是可以從論文中觀察出來的。
也就是說,人類的棋譜「並不是可以扔掉的」。

===



相關系列文章:

沒有留言:

張貼留言