呆大非叫獸的文抄公資料庫: 王銘琬九段的後阿發夠報告（１５）

2018年1月2日星期二

王銘琬九段的後阿發夠報告（１５）

［人類並沒有輸］

雖然我不太想太深入討論阿發夠零的論文，但為了解說阿發夠零的秘密，還是不得不說明以下的內容。

阿發夠零向全世界展現最深的印象，就是「沒有教學的學習打贏了有教學的學習」，但我們不得不說實
情是否如此，是相當微妙的。尤其這篇論文最受注目、也最受到媒體大幅報導的地方，就是阿發夠零僅
花了三天就用一百勝零敗痛宰阿發夠李世石版本、花了四十天後又用８９勝１１敗的成績打敗的阿發夠
Ｍａｓｔｅｒ版本，成績相當輝煌。

然而，這兩項對決中，阿發夠零和對手並不是使用「相同的條件」。圍棋ＡＩ之所以可以超越人類，是
靠著一層層神經網路（ＮＮ）的深度學習技術。也因此，ＮＮ的「層數」越多，學習效果就越好。

在阿發夠對上李世石先生之時，使用的神經網路是十三層，當時很多人已經覺得這「很了不起！」了，
但現在的神經網路已經可以超過了一百層了。因為和李世石對戰版本相比，阿發夠零的ＮＮ層數是標記
成「２０個區塊（Block）」。這種標記或許有點問題，實際上這個「２０個區塊」大約是相當於４０
層的神經網路。

換句話說，第一項的對決中，其實是４０層和１３層相比，獲勝可以說是理所當然的。至於和
Ｍａｓｔｅｒ版的對決，則是標記成「４０個區塊（Block）」，也就是相當於８０層的神經網路的版
本。由於Ｍａｓｔｅｒ是「２０個區塊（Block）」，所以第二項的對決也是「不同階級的對戰」。

因此，除了很期待能看到學習過人類棋譜的Ｍａｓｔｅｒ能同樣升級到８０層神經網路（「４０個區
塊（Block）」）與阿發夠零進行對決以外，還有其他值得注目之處。就是論文中提到了讓
Ｍａｓｔｅｒ和李世石版本時期的另一個版本對戰過。因為論文中這個對戰，是同樣以４０層（２０
個區塊）的方式來進行，這樣就很顯而易懂。

那麼為何論文中沒有另外再進行８０層的Ｍａｓｔｅｒ與８０層的阿發夠零進行對決呢？就常理推測，
就是阿發夠零在４０層的狀況下雖然能贏過李世石版本，卻贏不了同樣是４０層神經網路的
Ｍａｓｔｅｒ版本。換句話說，大家不要像柯潔一樣難過，因為「有學過人類棋譜」的ＡＩ版本和「
沒有學習過棋譜」的ＡＩ版本之４０層神經網路對決，是沒有輸掉的。這是可以從論文中觀察出來的。
也就是說，人類的棋譜「並不是可以扔掉的」。

＝＝＝

相關系列文章：

呆大非叫獸的文抄公資料庫

網頁

2018年1月2日星期二

王銘琬九段的後阿發夠報告（１５）

沒有留言:

張貼留言

網頁

2018年1月2日 星期二

王銘琬九段的後阿發夠報告（１５）

沒有留言:

張貼留言

2018年1月2日星期二