2021年3月6日 星期六

人類與AI的關係(05)


在圍棋界也有「XXX的時代已經結束了」的情形?!


採訪:現在最強的圍棋軟體既然是中國開發出來的,那日本棋士們所使用的AI軟體,應該也是使用海外開發的為主流對嗎?


大橋:沒錯,的確是這樣沒錯,但最近星陣隸屬的企業又推出了新的服務。他們在很強的伺服器上加了可以很輕鬆就連上的圍棋服務!


至今為止,日本的職業棋士為了連接到雲端伺服器不知道要花多大工夫...。現在因為中國的圍棋市場非常之大,所以就有數個可以輕鬆使用AI的服務出現。甚至連內建AI的電子棋盤都出現了!


採訪:哇,這聽起來好有趣!


大橋:是不是?!這樣就不需要自己花五十萬日圓左右去最新的GPU了。


採訪:又不會占地方啊。但這些服務可以用日語申購、操作嗎?


大橋:不行。畢竟是中國的應用程式(App)...。基本上,是可以用日語,但翻譯多少有點奇怪,還不如直接從中文去猜還比較好...。


採訪:這真可說是海外應用程式的經驗談呢。


大橋:其實大家都是這樣一面摸索一面使用的。只不過在日本,會使用這樣應用程式的人,要嘛是職業棋士、要嘛就是接近職業棋士棋力的人了。


採訪:這在中國當地,是業餘棋友也會大量使用的服務對嗎?


大橋:總之,中國的圍棋市場非常巨大。我想這也是為什麼中國的大企業願意在圍棋AI上投入這麼多心力的原因吧。


採訪:有人提出一個論點說將棋界因為將棋軟體的出現,造成職業將棋棋士與業餘棋士的差距縮小了。那麼在圍棋界的狀況又是怎樣呢?


大橋:在圍棋上,由藤澤小姐或上野小姐的女性棋士的活躍可以顯著看出來AI的效用。此外,喜歡AI的中年棋士會因此而重新活躍...我想這些狀態都是剛剛要起飛的階段。


另外也有整個圍棋界的程度層次變厚了的感覺。畢竟大家的佈局都進步了。使用AI一起研究,首先最容易受惠的就是佈局了。甚至還出現了研究佈局、中盤、官子和AI一致率的論文出現了。


至今為止,大家會有「圍棋是一種藝術」的想法。和高手對戰時,不知不覺形勢就會拉開了....這樣的狀況,現在是越來越少了。如果是用功研究的棋士們進行對局的話,就會看到佈局階段是走入公式套路的情況。


以往在領先群、可以輕鬆在對局中獲勝的人,現在往往也變成了並不是那麼容易獲勝了。


採訪:您提到了佈局會進入公式化的情形,那這樣是不是每個人下出來的棋都很像?


大橋:AI程式中會閃光的點....換句話說就是第一候補落點其實是大家都知道的。所以我覺得去找出那些AI程式中沒有閃光、但其實也是很有力的下法,並從中學習的棋士才會真正獲得好成績。其實這種在AI程式中沒有推薦卻很有力的棋可是意外的的多喔。


採訪:在將棋界,也是有渡邊名人(渡邊明)從圍棋界學到這種方法而持續獲勝的狀況呢!


大橋:遇到比自己稍微強一點的人時,誘使對方走入自己研究果的獲勝套路的方法其實滿多的,這從棋譜中就可以看得出來。


現在的AI是靠著自我對戰強化學習的方法提升棋力的。但這樣的方法,往往也導致AI很容易偏向某種喜歡的模式發展。


採訪:在將棋界,也是有水匠這樣的軟體靠著偏向居飛車的下法,而使其對其他軟體的勝率變高的情形。


大橋:過去人們大多都下小目小馬步締角的棋。但在AI都只下二間高締的棋,所以這幾年可說是二間高締的全盛時期...但到了最近去看絕藝或星陣下的棋,其實會發覺得它們下小馬步也沒甚麼不一樣。


而且,就算喜歡二間高締,其勝率評價值也只高0.3%左右而已。就這點來看,也是有故意研究小馬步締角來贏棋的棋士出現。


採訪:深度學習型的軟體越變越強的過程中,最佳手段...就是所謂的會閃亮的棋也會跟著改變嗎?


大橋:其實這也是常有的現象。只不過...這是一點點地變化,大約是如果不仔細看的話不會注意到的程度。



採訪:是這樣子的嗎?


大橋:其實現在還只是進步的過渡期而已,真的就是AI發展的初期罷了。


我覺得未來還有越來越強的可能。對了,「零類型」的AI,其實擅長的是半目獲勝的形式喔。


採訪:換句話說,是打算開發成可以驚險獲勝的形式嗎?


大橋:是。但是星陣認為與其這樣驚險獲勝,不如以勝利目數差距最大為目標開發出來的AI會更強。說誇張一點,AlphaGo Zero類型的AI是以「下一百局棋,全部都要能半目獲勝」為目標開發出來的,但星陣卻是以「這一局就要贏一百目」為目標來開發的。


採訪:這可是相當極端的變化啊!


大橋:圍棋AI對於到底應該下星位或小目總是會有些迷惘,零類型的AI是喜歡下星位。而星位從以前開始,就被人類認為是「均衡的一著」呢。


不過最近把目數加入模擬參數的星陣或Katago,卻逐漸增多了選擇下在小目的情況。而下在小目的話,就容易形成戰鬥性的棋局。


採訪:加入目數作為參數,就會對官子更有信心,所以才會變得比較好戰是嗎?


大橋:雖然無法證明其因果關係...但開發者們是這麼說的:「這只是碰巧,但能找出這種說法的人類思考,可說是非常有意思啊」(笑)。


受到AlphaGo的影響,人類棋界也流行起看到星位就直接進三三的下法,但是現在下星位卻變少了,反而是下小目比較多的狀況。


雖然大約兩年前左右,也曾經有國外的棋士說過:「小目時代已經結束了」...。


採訪:咦?這話好像在哪裡聽過?!


*將棋棋士增田康宏先生曾經說過「矢倉戰法的時代已經結束了」的名言。


大橋:日本的圍棋職業棋士中,雖然沒有像增田康宏先生那麼超級激烈的棋士(笑),但今後可能也會出現「星位的時代結束了」的話吧。


採訪:哈哈哈!


大橋:像這樣的感覺,其實是一點一點的變化,然後一直反覆循環出現的。


採訪:雖然因為深度學習法AI的出現,給人有圍棋發生了很巨大變化的印象,但以長遠的角度來看,其實也沒有變化那麼多...這樣說起來,圍棋根本就是才解析出來一點點而已嘛。


大橋:我在開發Globis-AQZ時,曾看過幾千局的棋譜...但是到了AI自我對戰數量到達一百萬局時,就會發現AI找到了新的一手棋,並且用新手下起難解定石了。但再跑一百萬局之後,你又會看到「這樣的變化果然還是不行」、然後又變回原本下法的情形...。


所以說AI到底是聰明還是不聰明?其實我都搞不懂了(笑)。


採訪:所以要看到AI第一著就下在天元上,恐怕還要等好久好久吧?


大橋:啊,我還真希望AI能夠第一手就下在天元上啊。不過用完全解析圍棋的角度來看,現在的AI其實還很幼稚...也許再過十年,也許它才會開始這樣下吧。如果用人類的角度來說,這相當於一百年的學習經驗呢。


採訪:這樣聽起來,還真是讓人搞不清楚AI到底是聰明還是不聰明啊(苦笑)。


===


相關系列文章:

沒有留言:

張貼留言