2017年10月23日 星期一

王銘琬九段的後阿發夠報告(5)


[曾經有過以圍棋軟體奪下世界第一的夢想]

我開始參加「GoTrend」開發團隊,則是大約三年前的事。這是因為當時靠「蒙地卡羅法」變強的速度變緩,到了業餘高段水準時看起來有撞牆的傾向的關係。

如果能將我的圍棋理論「空壓法」好好融入圍棋軟體中,預期能夠將電腦圍棋的棋力增強一子,也是這個團隊成立的理由之一。當時我的確有藉由圍棋軟體奪下世界第一的美夢。

就在阿發夠和李世石對戰之前,公布了阿發夠五連勝歐洲圍棋冠軍樊麾二段的棋譜。當時我偶然經過了碁世界雜誌的編輯室,有人告訴了我這件事,我就立刻在桌旁的棋盤上擺起了這五局的棋譜。

因為我知道了阿發夠使用了深度學習這樣的手法,讓我感覺到它和以往的圍棋軟體完全不同的特質。

1圖當黑1貼時,阿發夠下在2的位置上。我也覺得白棋應該要下在這附近,所以我的目光首先就移到了此處。此棋是攻防與寬度的要點,既可以加強自身、又能壓迫對手,而且剛好抓在了不近不遠的位置上,如果使用空壓法來次一手棋的話,此處絕對也是最優先的候補之一。

1圖 黑 樊麾二段 白 阿發夠
Oh_meien_02_01.png


這手白2並不是誰教它這麼下的一手棋,而是非要有自己的圍棋觀才想得出來、是「理解圍棋」的一著。這一著棋是不是正解且先不論,但的確是讓人感受到深度學習法強大實力的一著。

綜觀全局,其他的棋也是下的令人無話可說,讓我覺得就算當時是自己和它來下,要獲勝也非常困難。換句話說,電腦藉著深度學習,一口氣增強了三子以上的棋力。或者說它已經到了不是空壓法可以置喙的水準了。當我見到此局棋之時,也正是我心中開始把「圍棋軟體」看成「圍棋AI」的時刻。

像這樣在圍棋中,因為深度學習製造出了電腦超越人類的決定性效果,也就讓使用深度學習的圍棋軟體被稱為了圍棋AI。其實在其他的領域,也有很多例子也是沿著這條線來將軟體劃分為AI。

不過這樣的分類方法倒也不是絕對,有時沒有導入深度學習的軟體,也一樣會被稱為是AI,而這些軟體也通常會因為「AI帶給社會的影響」之類的評論,而深受大眾的注目。

由於在「自動自發地找出特徵,加以學習」這一點上,可說是具有特別的意義,因為實際上就是因為深度學習的關係,讓電腦圍棋的棋力有重大突破,所以在本連載中,就是把使用深度學習的軟體稱為AI。


[甚麼是自己的棋?]

那麼,我們人類能從阿發夠身上學到甚麼?就像前一篇所說過的一樣,首先要認識自己的棋,是非常重要的事;不過「自己的棋」是甚麼?實際上也是非常複雜麻煩的問題。至今為止,不僅是日本,整個圍棋界都不太去討論這個問題;而且在AI出現之前,大家可能也覺得沒甚麼必要去思考這個問題。

就像圍棋具有「手談」的別名一樣,每一手棋都具有一種或多種意義,也因此其本身就可以被看成是一種語言。去到外國旅行時,就算語言不通,但想要下棋的話還是能夠下棋,就是因為大家可以透過「圍棋」這種語言來進行會話的關係。

就這個意義來看,在圍棋中看棋譜時直接去品味是最好的方式,因為我們在棋譜的內容上另外加上言語敘述,就有疊床架屋之感,反而會錯失圍棋本來的型態。

其實柯潔在對局與研究中如果能從阿發夠上吸收到甚麼東西的話,我覺得一定也不是用「因為這樣所以這樣」的言語推理,而是吸收到轉換成語言前的感覺。換句話說,如果硬是要用言語來分析「自己的棋」,搞不好會越扯越遠哩。

不過,這樣的話又會變成不管說甚麼都沒用了,所以我們還是得透過文字將想傳達下去的東西表示出來。

在人類與電腦之間差異最大的地方,還是人類會對於各種局面賦予「意義」。就像剛才所介紹過的一樣,其實並不是使用語言,而是在「感覺上」賦予意義。

好比說2圖是前一篇也介紹過的阿發夠自我對戰第一局中的連碰。前一篇我們說這是「佈局才剛開始」,還不是具有甚麼「特徵」的局面,所以其實不用「故意」去下「碰」這種「處理」的手法才對。

2圖


但像上面這些說明,引號裡面的用詞,全部都是我特別賦予的意義。不過,每個人下棋的方式都不一樣,所以大家對於我賦予的這些意義也不一定要贊同,或者你可能沒辦法用具體的描述方式來表現也沒關係,總之你也會有你自己的見解。其實,人類就是藉著在局面上賦予意義來判斷好壞。像這樣,每個人從棋盤上感受到的「意義」,就是「自己的棋」之基礎。

不過,電腦並不會這樣對局面賦予意義。對阿發夠來說,上述引號中的文字,完全都是無意義的,它完全是用人類感受到意義以外的理由來下棋的。

其實,阿發夠還是有它自己的「圍棋觀」。就是它會朝著勝率更高的著手為目標來下棋,而且在學習過人類的棋譜之後,然後藉由可能超過一億局的自我對戰來繼續學習,才達到今天的棋力水準。這種方式,當然也不是我們人類能夠模仿的。

深度學習的成果,就是在細算上也能直接拿來應用。除了不會去計算惡手之外,還能對棋路進行很多的深入計算。由於人類的能力是有極限的,所以這種方法也不是人類能夠模仿的。

當然,我們人類也沒必要去這樣模仿。就像前一篇提到過的一樣,圍棋還是要「因為喜歡才去下」。通常圍棋會讓人感受到開心,就是在於雙方透過棋盤,能夠互相見識到對方對局面「賦予意義」的看法,進而互相比較,然後就在意義累積之間完成了一局棋,這種過程對於產生圍棋的樂趣可說是有很大的貢獻。

===



相關系列文章:

沒有留言:

張貼留言