呆大非叫獸的文抄公資料庫: 日本頂尖女子棋士的與ＡＩ的相處之道（０２）

採訪：Ｖ２的下法到底有多「奇特」？可以用實際的一招為例來介紹給我們這種圍棋初學者明白嗎？

大橋：舉例來說ＥＬＦ　Ｖ２代表性的著手，就是小目用小尖來締角。

註：

小目就是從棋盤角落算起，相當於座標（３，４）或（４，３）的位置。

小尖就是下在從自己的棋子算起斜對角一路的位置。

締角就是確定自己角上領地的手法。

ＡＷＳ　Ｊａｐａｎ的瀧口開資方案結構師（陪同參加採訪）：（一面畫著如上的例圖一面說）持黑的時候在小目已經有子的情況下，普通為了確定角地的話會下小馬步締角（上圖Ａ位）或是一間締角（上圖Ｂ位），但ＥＬＦ　Ｖ２卻是會下小尖（上圖黑１）。

上野：ＥＬＦ持白的時候，在對手黑棋下在小目之時，也會下在尖的位置（上圖１）來掛角。通常要掛角時，白棋大多是下在小馬步掛（上圖Ａ位）或一間高掛（上圖Ｂ位），可是ＥＬＦ　Ｖ２還是下在小尖的位置上。

註：

掛角就是下在對手角上的棋子附近，妨礙對方圍住角地。

大橋：對。ＥＬＦ　Ｖ２不論黑白，都是在這麼下。持白時是小尖掛角，持黑就是小尖締角。

採訪：也就是一般不讓對手馬上圍到角地時會下在空一格的地方，而ＥＬＦ　Ｖ２卻有點像突然打出勝負手的感覺是嗎？

大橋：也的確有這樣的感覺。因為以前從未有過這種想法的棋士，所以這也是為什麼我們看到新秀棋士這樣下時就知道「啊，他有在用ＥＬＦ　Ｖ２」的原因（笑）。

雖然不知道像ＥＬＦ　Ｖ２這種變種是怎麼生出來的，但的確聽說在圍棋ＡＩ彼此對戰的狀況下ＥＬＦ　Ｖ２是非常強的。

採訪：是不是它具有圍棋ＡＩ殺手的特性？

大橋：也許是這樣吧？只不過，就人類看起來，這樣的下法真的太奇怪，不會想要採用成自己的下法．．．。

採訪：那麼實際上使用ＥＬＦ　Ｖ２這樣的手法時到底是便宜還是吃虧呢？

大橋：嗯．．．這問題很難講。

上野：哎呀，至少可以說不是能推薦給別人學的下法（笑）。和ＥＬＦ　Ｖ２相比，ＥＬＦ　Ｖ１就稍微「普通」一點了。

採訪：所以說ＥＬＦ　Ｖ１比較像人類棋士對嗎？

上野：不，即便是Ｖ１，和Leela Zero相比還是比較不像人類。我覺得最讓人感覺到像人類下法的，則是GLOBIS-AQZ。

註：

GLOBIS-AQZ是圍棋ＡＩ軟體ＡＱ的開發者山口祐先生，以Tripleize公司團隊為中心重新開發出的圍棋ＡＩ軟體。

瀧口：如果用不等式來表示的話，就是

AQZ＜Leela Zero＜＜ＥＬＦ　Ｖ１＜＜難以超越的距離＜＜ＥＬＦ　Ｖ２吧？

採訪：原來如此。如果以是否接近人類來算的話，依序就是AQZ、Leela Zero、ＥＬＦ　Ｖ１，然後有一段很難超越的距離後才是ＥＬＦ　Ｖ２對嗎？

上野：是的，就是這樣的感覺。這個不等式還滿容易理解的嘛。

大橋：這個「和人類之間的距離」不等式，我覺得剛好也能用來區分圍棋ＡＩ的喜好。

採訪：以上提到的這幾個圍棋ＡＩ軟體，都像AlphaGo Zero一樣，不靠人類的棋譜，而是憑藉著電腦自我對戰而變強的圍棋ＡＩ。但卻因為軟體的不同造成「像人類的特徵」有很大的不同，這倒滿好玩的。

瀧口：有沒有覺得Ｖ１的棋路有比較偏「攻擊性」或「防守性」的特徵？

上野：Ｖ１是稍微攻擊性的棋風吧。

瀧口：上野老師因為常常一口氣強吃對手大龍的攻擊性風格而被稱為「大鐵鎚（hammer）」，難道這就是Ｖ１給您帶來的影響嗎？

上野：也許是有受到影響，不過喜歡攻擊的棋風是我從以前開始就這樣了。

採訪：所以就這點來說，Ｖ１也許是「和上野老師個性相符的ＡＩ」對嗎？

上野：啊，這倒非常有可能是這樣。如果是比較冷靜型的棋士的話，應該會覺得Leela Zero比較好才對。

大橋：還有，圍棋ＡＩ的評價值變化會不會很劇烈，也是棋士們對於圍棋ＡＩ喜好分別的一個重大參數。畢竟自己下的棋被ＡＩ分析成評價值低於１０％時，心情還是會很挫折的（笑）。

人類和ＡＩ到底是怎麼判斷局面是有利或不利的？

採訪：我想請教一下各位職業棋士老師們，到底是怎麼來活用圍棋ＡＩ的？是在局後檢討時參考局面的評價值（就是圍棋ＡＩ判斷當時盤面某一方的勝率）呢？或是直接跟圍棋ＡＩ對戰來學習它的棋路？

上野：這會隨著版本不同而有所變化喔。我的話，會使用ＥＬＦ　Ｖ１來進行我和人類棋士對局時的局面分析。如果圍棋ＡＩ可以很清楚直接地將壞棋評價成「糟糕」的話，我就會覺得很好用。

至於使用ＥＬＦ　Ｖ２的職業棋士，雖然只是推測，但其動機可能是「想看看人類不會下的新手」吧？

大橋：其實也常常出現不同的圍棋ＡＩ對於局面的評價值有所不同的情形，ＥＬＦ　Ｖ２特別是有這樣的傾向。明明每家ＡＩ大多認為「黑好」時，卻只有ＥＬＦ　Ｖ２會認為是「白好」，然後你讓這些圍棋ＡＩ都模擬到最後，結果又都是會下成半目輸贏。這樣的例子我試過好多次了，到了最後都會變成很緊張的形勢，常常輸贏都很小。

上野：在我剛導入ＥＬＦ　Ｖ１時，常常被Ｖ１所下的棋給嚇到，但最近就不太會驚訝了。我自己的形勢判斷也和Ｖ１的盤面評價值也變得非常相近。

剛好某一次我們在用其他的圍棋ＡＩ檢討時，我的形勢判斷和那個ＡＩ的評價值完全不同，讓我覺得很沒自信；但後來改用我慣用的ＡＩ（就是ＥＬＦ　Ｖ１）確認時，卻還是相當一致，就讓我覺得「啊，太好了」而安心起來（笑）。果然Ｖ１還是和我很合呢。

採訪：順便想請教一下，職業棋士們大家的腦袋中到底是怎麼判斷「這個局面很好（有利）」或「這個局面不好（不利）」的呢？是用一定的道理來判斷呢？還是根據印象來判斷呢？

上野：我的話是用「組合」的方式來判斷。比如說某個地方佔多少％？這裡多少％？那裏又是多少％？這樣全部加起來應該就不會錯太多，大致是這樣的感覺。

大橋：真厲害！我想上野小姐的腦內恐怕已經是人類和ＡＩ的感覺高度整合起來了吧。

看了上野小姐這樣的說法，我覺得人類的腦袋中也可以像ＡＩ的盤面評價神經網路一樣，至少經過半年持續專注於一種圍棋ＡＩ的話就能一樣好。因為如果評價不一致的話，就無法活用出圍棋ＡＩ的長處了。

採訪：AlphaGo型的圍棋ＡＩ所使用的旋積（Convolution）神經網路，其作業特性就是先從棋盤上狹小領域開始進行細部的評價，再漸漸拓展成棋盤全體的評價。我想各位職業棋士們應該有機會在自己的腦海中創造出接近神經網路評價的思考能力吧？

大橋：我也這麼覺得。至少現在的年輕棋士們似乎就是逐漸朝向這個方向前進了。

瀧口：那個累積判斷的講法似乎可以看到很接近ＡＩ的部分呢。

採訪：那麼就是一直和圍棋ＡＩ對弈來學習其下法的方式，算是一種有效的活用圍棋ＡＩ方法嗎？

上野：其實我並不喜歡和ＡＩ對局．．．。

大橋：嗯，果然上野小姐是不和圍棋ＡＩ對弈的呢。果然還是是不想把圍棋ＡＩ當對局對手，而是做為局面優劣評價的工具啊。雖然說還是有那種會一直和ＡＩ對戰訓練的職業棋士。

上野：我覺得能和圍棋ＡＩ對戰的人，其心理層面一定要很相當堅強才行。

大橋：在中國，的確有那種和圍棋ＡＩ對弈然後連敗兩千盤的世界冠軍級的棋士喔。

採訪：啊？兩千連敗！

大橋：就是中國的頂尖棋士，陳耀燁九段。他和中國的最強圍棋ＡＩ「絕藝」下了兩千局，聽說全部都輸掉。

採訪：這也太猛了。

大橋：一開始他和ＡＩ下時，前三十手的階段是從評價值來看就完全不行的（人類必敗），但到了兩千連敗後，他可以下到前一百手和ＡＩ是平分秋色的狀態了。

採訪：能和那麼厲害的絕藝下到百手為止平分秋色，我覺得是非常厲害的事。

大橋：能夠下到那樣的程度的話，在人類世界就能當上世界第一了吧。但如果是一般人的話，再連敗兩千盤前，心裡早就崩潰到不行了吧。

現在，中國的職業棋士在世界賽中非常厲害。甚至也有那種佈局階段下的棋和絕藝預測落點的一致率高達六成這種非常高水準的棋士。

上野：以前和中國職業棋士對局輸掉之時，我自己完全沒注意到「對手下的棋和絕藝很像」，後來我用絕藝的舊版本確認過，才知道對方下的棋和絕藝的預測落點的一致率非常高，而且我從佈局階段就已經在評價值上落後了。其實對方根本就是在佈局階段取得領先，然後一路維持領先跑到終點，但我在下的時候完全沒發現是這樣的狀況。

＝＝＝

相關系列文章：

呆大非叫獸的文抄公資料庫

網頁

2019年12月29日星期日

日本頂尖女子棋士的與ＡＩ的相處之道（０２）

沒有留言:

張貼留言

網頁

2019年12月29日 星期日

日本頂尖女子棋士的與ＡＩ的相處之道（０２）

沒有留言:

張貼留言

2019年12月29日星期日