網頁

2017年10月22日 星期日

王銘琬九段的後阿發夠報告(4)



第二回 到圍棋軟體被稱為AI為止

[阿發夠的武器]

現在報紙或電視新聞,幾乎沒有哪天看不到AI二字。如果談到AI這個話題,最常出現的,就是去年3月阿發夠對李世石之戰的照片,而且還會特別介紹這是「圍棋AI」阿發夠打敗了人類。

其實AI(人工智能)這個名詞,是從1950年代開始就有了,而且其涵蓋的範圍非常廣,好比說著名的西洋棋軟體「深藍」、或是烤箱(譯註:水波爐?)的調理功能,都是AI。但是以前我們卻不太常把這些東西說成是「AI」。其實在圍棋上也是,在阿發夠出現之前,大家也都不會把這些對局軟體稱為AI,還是直接稱為「圍棋軟體」。

至於阿發夠和過去的圍棋軟體相比,最大的差異還是導入了「深度學習」的技術。甚至可以說,就是因為開始使用了深度學習,這些軟體才開始被稱為「AI」的。

在阿發夠出世之前,就算是在歐美,只要是提到了圍棋,也是以「目前電腦還打敗不了人類的一種遊戲」而著名。只要是圍棋雜誌的忠實讀者就知道,這是因為在圍棋中,局面的評價是非常曖昧不明、變化數量又是壓倒性的巨大,可說是以前的電腦非常不擅長的問題類型。

在深藍剛打敗人類的1990年代,圍棋軟體才好不容易能夠下出有點像樣的棋而已,直到進入21世紀之時,它的棋力也還很難到達業餘初段的程度。當時的圍棋軟體,是非得要把圍棋知識從零開始一一全部輸入進去告訴電腦才行,也因此軟體的強弱跟軟體作者本身的棋力有很大的關聯性,所以當時比較強的圍棋軟體作者,都是業餘高手等級。

[開始有了棋感(感覺)]

到了2006年,圍棋軟體有了很大的進展。這是因為開發出了一種把對局中的局面從開局到終局為止用電腦去算非常多模擬結果、並且根據這些模擬結果的勝率來判斷局面的「蒙地卡羅法」。

因為對於圍棋軟體來說是最大課題的「局面評價」可以用這種方式來進行,也讓圍棋軟體有了可以「細算」的可能性,而讓電腦的棋力在數年之間到達了業餘高段的程度。

也是圍棋軟體具有了「自我判斷」的能力,所以他的棋力高低就和作者的棋力不是那麼相關,反而讓寫程式的功力成為關鍵,此時圍棋軟體的棋力超越作者本人的狀況,也開始成為了常例。

此時圍棋軟體變強的原因,也跟導入了「機器學習」有關。如果指示它去大量學習某些棋譜中應該學習的特徵、並且讓電腦記住這些特徵,就會對模擬或是次一手預測(候補落點)的品質有很有更進一步的貢獻。

至於「深度學習」其實也是機器學習的一種,但這種學習法的優秀之處,是不必告訴它人類所訂定好的特徵,它可以自發性地找出該學習的特徵而進行學習。也就是說,人類不需要告訴電腦任何東西,它自己就會進步。

利用不需要教導的深度學習,電腦反而就會「體會」出用言語無法表達的「棋感(感覺)」。而原本就有宛如鬼神般強大計算力的電腦,又加上了「持續變強的感覺」的金箍棒(譯註:這是日式諺語「給鬼金棒」的梗,其意義就像是中文的「如虎添翼」),所以就能贏過人類了。

而且由於甚麼都不必教導就可以了,所以現在圍棋軟體的作者,根本連棋力都不需要了。好比說阿發夠的開發團隊二十幾人中,有非常多人不會下圍棋;現在緊追在後的中國圍棋AI「絕藝」團隊中,全體13人都不會下圍棋。

===



相關系列文章:

沒有留言:

張貼留言