2019年12月29日 星期日

日本頂尖女子棋士的與AI的相處之道(02)


採訪:V2的下法到底有多「奇特」?可以用實際的一招為例來介紹給我們這種圍棋初學者明白嗎?

大橋:舉例來說ELF V2代表性的著手,就是小目用小尖來締角。


註:
小目就是從棋盤角落算起,相當於座標(3,4)或(4,3)的位置。
小尖就是下在從自己的棋子算起斜對角一路的位置。
締角就是確定自己角上領地的手法。

AWS Japan的瀧口開資方案結構師(陪同參加採訪):(一面畫著如上的例圖一面說)持黑的時候在小目已經有子的情況下,普通為了確定角地的話會下小馬步締角(上圖A位)或是一間締角(上圖B位),但ELF V2卻是會下小尖(上圖黑1)。

上野:ELF持白的時候,在對手黑棋下在小目之時,也會下在尖的位置(上圖1)來掛角。通常要掛角時,白棋大多是下在小馬步掛(上圖A位)或一間高掛(上圖B位),可是ELF V2還是下在小尖的位置上。

註:

掛角就是下在對手角上的棋子附近,妨礙對方圍住角地。

大橋:對。ELF V2不論黑白,都是在這麼下。持白時是小尖掛角,持黑就是小尖締角。



採訪:也就是一般不讓對手馬上圍到角地時會下在空一格的地方,而ELF V2卻有點像突然打出勝負手的感覺是嗎?

大橋:也的確有這樣的感覺。因為以前從未有過這種想法的棋士,所以這也是為什麼我們看到新秀棋士這樣下時就知道「啊,他有在用ELF V2」的原因(笑)。

雖然不知道像ELF V2這種變種是怎麼生出來的,但的確聽說在圍棋AI彼此對戰的狀況下ELF V2是非常強的。

採訪:是不是它具有圍棋AI殺手的特性?

大橋:也許是這樣吧?只不過,就人類看起來,這樣的下法真的太奇怪,不會想要採用成自己的下法...。

採訪:那麼實際上使用ELF V2這樣的手法時到底是便宜還是吃虧呢?

大橋:嗯...這問題很難講。

上野:哎呀,至少可以說不是能推薦給別人學的下法(笑)。和ELF V2相比,ELF V1就稍微「普通」一點了。

採訪:所以說ELF V1比較像人類棋士對嗎?

上野:不,即便是V1,和Leela Zero相比還是比較不像人類。我覺得最讓人感覺到像人類下法的,則是GLOBIS-AQZ。

註:

GLOBIS-AQZ是圍棋AI軟體AQ的開發者山口祐先生,以Tripleize公司團隊為中心重新開發出的圍棋AI軟體。

瀧口:如果用不等式來表示的話,就是

AQZ<Leela Zero<<ELF V1<<難以超越的距離<<ELF V2吧?

採訪:原來如此。如果以是否接近人類來算的話,依序就是AQZ、Leela Zero、ELF V1,然後有一段很難超越的距離後才是ELF V2對嗎?

上野:是的,就是這樣的感覺。這個不等式還滿容易理解的嘛。

大橋:這個「和人類之間的距離」不等式,我覺得剛好也能用來區分圍棋AI的喜好。

採訪:以上提到的這幾個圍棋AI軟體,都像AlphaGo Zero一樣,不靠人類的棋譜,而是憑藉著電腦自我對戰而變強的圍棋AI。但卻因為軟體的不同造成「像人類的特徵」有很大的不同,這倒滿好玩的。

瀧口:有沒有覺得V1的棋路有比較偏「攻擊性」或「防守性」的特徵?

上野:V1是稍微攻擊性的棋風吧。

瀧口:上野老師因為常常一口氣強吃對手大龍的攻擊性風格而被稱為「大鐵鎚(hammer)」,難道這就是V1給您帶來的影響嗎?

上野:也許是有受到影響,不過喜歡攻擊的棋風是我從以前開始就這樣了。

採訪:所以就這點來說,V1也許是「和上野老師個性相符的AI」對嗎?

上野:啊,這倒非常有可能是這樣。如果是比較冷靜型的棋士的話,應該會覺得Leela Zero比較好才對。

大橋:還有,圍棋AI的評價值變化會不會很劇烈,也是棋士們對於圍棋AI喜好分別的一個重大參數。畢竟自己下的棋被AI分析成評價值低於10%時,心情還是會很挫折的(笑)。

人類和AI到底是怎麼判斷局面是有利或不利的?

採訪:我想請教一下各位職業棋士老師們,到底是怎麼來活用圍棋AI的?是在局後檢討時參考局面的評價值(就是圍棋AI判斷當時盤面某一方的勝率)呢?或是直接跟圍棋AI對戰來學習它的棋路?

上野:這會隨著版本不同而有所變化喔。我的話,會使用ELF V1來進行我和人類棋士對局時的局面分析。如果圍棋AI可以很清楚直接地將壞棋評價成「糟糕」的話,我就會覺得很好用。

至於使用ELF V2的職業棋士,雖然只是推測,但其動機可能是「想看看人類不會下的新手」吧?

大橋:其實也常常出現不同的圍棋AI對於局面的評價值有所不同的情形,ELF V2特別是有這樣的傾向。明明每家AI大多認為「黑好」時,卻只有ELF V2會認為是「白好」,然後你讓這些圍棋AI都模擬到最後,結果又都是會下成半目輸贏。這樣的例子我試過好多次了,到了最後都會變成很緊張的形勢,常常輸贏都很小。

上野:在我剛導入ELF V1時,常常被V1所下的棋給嚇到,但最近就不太會驚訝了。我自己的形勢判斷也和V1的盤面評價值也變得非常相近。

剛好某一次我們在用其他的圍棋AI檢討時,我的形勢判斷和那個AI的評價值完全不同,讓我覺得很沒自信;但後來改用我慣用的AI(就是ELF V1)確認時,卻還是相當一致,就讓我覺得「啊,太好了」而安心起來(笑)。果然V1還是和我很合呢。
採訪:順便想請教一下,職業棋士們大家的腦袋中到底是怎麼判斷「這個局面很好(有利)」或「這個局面不好(不利)」的呢?是用一定的道理來判斷呢?還是根據印象來判斷呢?

上野:我的話是用「組合」的方式來判斷。比如說某個地方佔多少%?這裡多少%?那裏又是多少%?這樣全部加起來應該就不會錯太多,大致是這樣的感覺。

大橋:真厲害!我想上野小姐的腦內恐怕已經是人類和AI的感覺高度整合起來了吧。

看了上野小姐這樣的說法,我覺得人類的腦袋中也可以像AI的盤面評價神經網路一樣,至少經過半年持續專注於一種圍棋AI的話就能一樣好。因為如果評價不一致的話,就無法活用出圍棋AI的長處了。

採訪:AlphaGo型的圍棋AI所使用的旋積(Convolution)神經網路,其作業特性就是先從棋盤上狹小領域開始進行細部的評價,再漸漸拓展成棋盤全體的評價。我想各位職業棋士們應該有機會在自己的腦海中創造出接近神經網路評價的思考能力吧?

大橋:我也這麼覺得。至少現在的年輕棋士們似乎就是逐漸朝向這個方向前進了。

瀧口:那個累積判斷的講法似乎可以看到很接近AI的部分呢。

採訪:那麼就是一直和圍棋AI對弈來學習其下法的方式,算是一種有效的活用圍棋AI方法嗎?

上野:其實我並不喜歡和AI對局...。

大橋:嗯,果然上野小姐是不和圍棋AI對弈的呢。果然還是是不想把圍棋AI當對局對手,而是做為局面優劣評價的工具啊。雖然說還是有那種會一直和AI對戰訓練的職業棋士。

上野:我覺得能和圍棋AI對戰的人,其心理層面一定要很相當堅強才行。

大橋:在中國,的確有那種和圍棋AI對弈然後連敗兩千盤的世界冠軍級的棋士喔。

採訪:啊?兩千連敗!

大橋:就是中國的頂尖棋士,陳耀燁九段。他和中國的最強圍棋AI「絕藝」下了兩千局,聽說全部都輸掉。

採訪:這也太猛了。

大橋:一開始他和AI下時,前三十手的階段是從評價值來看就完全不行的(人類必敗),但到了兩千連敗後,他可以下到前一百手和AI是平分秋色的狀態了。

採訪:能和那麼厲害的絕藝下到百手為止平分秋色,我覺得是非常厲害的事。

大橋:能夠下到那樣的程度的話,在人類世界就能當上世界第一了吧。但如果是一般人的話,再連敗兩千盤前,心裡早就崩潰到不行了吧。

現在,中國的職業棋士在世界賽中非常厲害。甚至也有那種佈局階段下的棋和絕藝預測落點的一致率高達六成這種非常高水準的棋士。

上野:以前和中國職業棋士對局輸掉之時,我自己完全沒注意到「對手下的棋和絕藝很像」,後來我用絕藝的舊版本確認過,才知道對方下的棋和絕藝的預測落點的一致率非常高,而且我從佈局階段就已經在評價值上落後了。其實對方根本就是在佈局階段取得領先,然後一路維持領先跑到終點,但我在下的時候完全沒發現是這樣的狀況。

===

相關系列文章:

沒有留言:

張貼留言