[人類並沒有輸]
雖然我不太想太深入討論阿發夠零的論文,但為了解說阿發夠零的秘密,還是不得不說明以下的內容。
阿發夠零向全世界展現最深的印象,就是「沒有教學的學習打贏了有教學的學習」,但我們不得不說實
情是否如此,是相當微妙的。尤其這篇論文最受注目、也最受到媒體大幅報導的地方,就是阿發夠零僅
花了三天就用一百勝零敗痛宰阿發夠李世石版本、花了四十天後又用89勝11敗的成績打敗的阿發夠
Master版本,成績相當輝煌。
情是否如此,是相當微妙的。尤其這篇論文最受注目、也最受到媒體大幅報導的地方,就是阿發夠零僅
花了三天就用一百勝零敗痛宰阿發夠李世石版本、花了四十天後又用89勝11敗的成績打敗的阿發夠
Master版本,成績相當輝煌。
然而,這兩項對決中,阿發夠零和對手並不是使用「相同的條件」。圍棋AI之所以可以超越人類,是
靠著一層層神經網路(NN)的深度學習技術。也因此,NN的「層數」越多,學習效果就越好。
靠著一層層神經網路(NN)的深度學習技術。也因此,NN的「層數」越多,學習效果就越好。
在阿發夠對上李世石先生之時,使用的神經網路是十三層,當時很多人已經覺得這「很了不起!」了,
但現在的神經網路已經可以超過了一百層了。因為和李世石對戰版本相比,阿發夠零的NN層數是標記
成「20個區塊(Block)」。這種標記或許有點問題,實際上這個「20個區塊」大約是相當於40
層的神經網路。
但現在的神經網路已經可以超過了一百層了。因為和李世石對戰版本相比,阿發夠零的NN層數是標記
成「20個區塊(Block)」。這種標記或許有點問題,實際上這個「20個區塊」大約是相當於40
層的神經網路。
換句話說,第一項的對決中,其實是40層和13層相比,獲勝可以說是理所當然的。至於和
Master版的對決,則是標記成「40個區塊(Block)」,也就是相當於80層的神經網路的版
本。由於Master是「20個區塊(Block)」,所以第二項的對決也是「不同階級的對戰」。
Master版的對決,則是標記成「40個區塊(Block)」,也就是相當於80層的神經網路的版
本。由於Master是「20個區塊(Block)」,所以第二項的對決也是「不同階級的對戰」。
因此,除了很期待能看到學習過人類棋譜的Master能同樣升級到80層神經網路(「40個區
塊(Block)」)與阿發夠零進行對決以外,還有其他值得注目之處。就是論文中提到了讓
Master和李世石版本時期的另一個版本對戰過。因為論文中這個對戰,是同樣以40層(20
個區塊)的方式來進行,這樣就很顯而易懂。
塊(Block)」)與阿發夠零進行對決以外,還有其他值得注目之處。就是論文中提到了讓
Master和李世石版本時期的另一個版本對戰過。因為論文中這個對戰,是同樣以40層(20
個區塊)的方式來進行,這樣就很顯而易懂。
那麼為何論文中沒有另外再進行80層的Master與80層的阿發夠零進行對決呢?就常理推測,
就是阿發夠零在40層的狀況下雖然能贏過李世石版本,卻贏不了同樣是40層神經網路的
Master版本。換句話說,大家不要像柯潔一樣難過,因為「有學過人類棋譜」的AI版本和「
沒有學習過棋譜」的AI版本之40層神經網路對決,是沒有輸掉的。這是可以從論文中觀察出來的。
也就是說,人類的棋譜「並不是可以扔掉的」。
就是阿發夠零在40層的狀況下雖然能贏過李世石版本,卻贏不了同樣是40層神經網路的
Master版本。換句話說,大家不要像柯潔一樣難過,因為「有學過人類棋譜」的AI版本和「
沒有學習過棋譜」的AI版本之40層神經網路對決,是沒有輸掉的。這是可以從論文中觀察出來的。
也就是說,人類的棋譜「並不是可以扔掉的」。
===
相關系列文章:
沒有留言:
張貼留言