2021年3月2日 星期二

人類與AI的關係(01)

譯自:NicoNico


現今圍棋界發展出來的人類與AI的關係


~中國企業二強時代、對AI兩千連敗才能成長為人類最強棋士 ,與將棋界不同的面對AI方式。


[前言]


1997年,IBM公司開發出來的西洋棋AI「深藍」打倒人類最強的西洋棋棋士卡斯帕洛(Garry Kasparo,當時的西洋棋世界冠軍)時,有很多將棋的職業棋士都這麼說:


「將棋比西洋棋複雜多了,所以在我們有生之年,是不可能被AI打敗的」。


結果在16年後的2013年,山本一成先生所開發出來的將棋AI「Ponanza」打敗了佐藤慎一四段(當時)。這次則是有很多的圍棋職業棋士這麼說:


「圍棋遠比將棋複雜多了,所以在我們絕對不可能輸給電腦」。


然而就在短短三年後的2016年,Deepmind公司開發出來的圍棋AI「AlphaGo」打敗世界頂尖級的棋士李世石時,全世界都因此極度慌亂起來:


「人類的工作都要被機械奪走了!」


在日本國內,可能會有電王戰中將棋AI打敗職業將棋棋士時報導還比較盛大的印象,但用世界規模的角度來看,可是圍棋AI打倒世界頂尖職業棋士時的新聞遠遠更加轟動。


為何會這樣?


理由之一,就是AlphaGo的開發與超巨大科技業龍頭Google有關。


另外一個理由,就是這個圍棋AI是利用深度學習(Deep Learning)這樣的技術開發出來的。


所以今後將棋AI的開發,可以預測也會是由深度學習類的軟體來主導才對。


這過程中,到底有甚麼東西被改變了呢?


深度學習技術的圍棋軟體,下的又是怎樣風格的圍棋?


要導入深度學習會很困難嗎?開發規模又是如何?怎樣應用到研究上?


所以我們就要請參與過其中開發的職業棋士大橋拓文六段來談談關於圍棋AI的種種影響。I


採訪.文:白鳥士郎


===


其實和進藤光同世代?!


採訪:初次見面,今天請您多多指教。


大橋:我是大橋,也請多多指教。


採訪:其實從以前開始就和您在推特上有往來,所以其實並不太有那種初次見面的感覺(笑)。


大橋:不過並非看到帳號圖示,而是親眼看到彼此的面貌,還是會覺得有點不可思議哩...(笑)。


採訪:呵呵。其實大橋老師除了推特以外,可說是驅使了所有的媒體來努力推廣圍棋。稍微去搜尋閱讀與圍棋AI相關的報導,大致上都是大橋老師解說的...。


大橋:的確,有很多媒體給我這個機會來幫忙。


採訪:這次的採訪,其實也是我在推特上發言說「想要找圍棋職業棋士來談談深度學習類的軟體」,您就立刻回覆:「我隨時都可以幫忙喔」,才能實現的。話雖如此,我對於圍棋的了解,就僅止於「棋靈王」而已,可能就會有一些瞎猜的失言...


大橋:我其實是和進藤光(棋靈王的主角)同世代喔。


採訪:咦?!


大橋:棋靈王卡通的最後面,不是有負責監製顧問的吉原(梅澤)由香里女士演出的「GoGo圍棋」單元嗎?


採訪:有有有。這個單元記得在DVD版中也有收錄。


大橋:在這個單元中,曾經介紹過新入段的職業棋士,然後就在被介紹的井山裕太先生(三冠得主+阿含桐山盃+NHK杯)的旁邊,我也出現了一下下,大約一秒左右吧。(笑)


採訪:這也太厲害了吧!在看這篇採訪的讀者朋友們應該也有人知道「啊,就是那個單元!」才對。一定會有吧。


大橋:在我還在當院生的時候左右,曾經目擊棋靈王的原作者堀田由美來日本棋院取材喔。故事一開頭就出場的三谷,我覺得就是拿和我同期當院生的三谷哲平(現在為職業七段)當範本畫出來的才對。


採訪:那個下棋手腳不乾淨的三谷就是三谷哲平先生嗎?


大橋:真實世界中的三谷倒是不會偷偷移動棋子就是了。(笑)


採訪:動手腳作弊來下棋賭錢、結果輸給真正靠圍棋賺錢的老江湖...而阿光又幫忙打倒了這個老江湖。包含顧慮到三谷前途的棋社老闆老伯在內,這可說是整部漫畫初期的傑作呢。


大橋:堀田由美老師來取材拍照時,剛好我和三谷都在,堀田老師還特別問我們:「可以在漫畫中使用你們的名字嗎?」....所以我就在想故事中的三谷應該就是三谷哲平吧。


採訪:哇,真是不得了的秘辛啊。那麼大橋老師對於棋靈王應該有很深的感情對嗎?


大橋:嗯,基本上是全部看過了,結果對伊角或和谷的故事太過感情投入了...


採訪:是說伊角對於職業棋士考試的心結或和谷對阿光的忌妒這些部分嗎?


大橋:其實漫畫就是把我當時想的、卻無法用言語表現出來的東西,全部寫成故事中的台詞了啦。


採訪:啊...這樣讀起來會很辛酸吧。其實我也對於把小說家或漫畫家當主角的作品,有看不太下去的感覺(苦笑)。


大橋:有些話雖然沒說出口,往往還是會存在心中的某個角落對嗎?我就是無法直視這些東西啊。我是那種喜歡的漫畫就會反覆讀很多次的人...但棋靈王對我來說,真是太痛苦了。


採訪:可見這故事有多真實...。


大橋:就是因為當過院生,就特別能感同身受。如果比我小五歲左右,也就是當時十歲左右的人,應該都是抱持著嚮往圍棋職業棋士的心情在看這部漫畫吧。所以這個年齡世代的人也特別多。去到學生圍棋比賽的現場,就會發現這個世代的人數是其他世代的1.5倍左右吧(笑)。


採訪:沒想到一上來就突然把跟圍棋AI沒有關係的事情講得那麼開心了,不過能聽到如此精彩的故事,也真是太滿足了。這讓我有這一定會是篇充實採訪的預感啊!


人類追上了AlphaGo


採訪:那我還是趕快來請教一下關於圍棋AI的問題吧。但是如果一直提到了您過去接受採訪被問到的問題的話,就請多多包涵了...。


大橋:其實我也有很多資訊要更新,所以沒問題的!


採訪:果然圍棋AI的進化非常快啊!那麼可以先從帶給圍棋界非常大衝擊的AlphaGo開始談嗎?沒記錯的話,AlphaGo贏了李世石先生、達成「超越人類」目標,是在2016年3月的事,距今才不過五年之前而已。


大橋:很有趣對吧。最近的世界頂尖棋士們,好比說中國的柯潔先生、韓國的申真諝先生等等,恐怕都下得贏AlphaGo最先出來的那個版本了(俗稱AlphaGo-Lee版本)。


採訪:哇?!可是柯潔先生在2017年5月和AlphaGo(俗稱Master版本)對戰時是吃下了三連敗啊...您的意思是在那之後人類還有持續進步嗎?


大橋:是。其實感覺上現在的人類對以前的人類棋士大約有七成以上的勝率。(譯註:等於棋力相差一先了)


採訪:哇?!那變強爆炸多的啊...。


大橋:不管是佈局的研究、或是中盤戰鬥等許許多多方面,都有顯著變強的感覺,雖然還不到強到可以讓很多子的程度...但要是以對等條件來下的話(分先),我覺得當代的棋士很難輸掉才對。


採訪:如果用評分(Rating)的數字來看的話,進步多少?


大橋:就算用評分來看,贏過李世石的AlphaGo版本(Lee版本)的評分跟現在人類的頂尖棋士也是幾乎同一水準。


採訪:那麼現在最強的圍棋AI,比起AlphaGo變強多少呢?


大橋:哎...AI的進化可就更快到難以相比了(嘆)。


採訪:果然如此啊...。


大橋:比起將棋AI和人類頂尖棋士的差距,圍棋AI和人類的差距可能更大喔。


採訪:怎、怎麼會...。不過將棋AI現在也是深度學習型的軟體爬到世界第一了。


大橋:圍棋AI藉著深度學習,而有了飛躍性的進步。再這之前無法做出很好的評價(形勢)的函數,而是用蒙地卡羅法這種靠統計機率的手法,來進行下在哪裏勝率會變高的模擬。


而帶來革命性突破的就是深度學習法。使用深度學習法就能做出好的評價函數,而讓電腦程式飛躍性的進步。


採訪:是的。


大橋:將棋則是靠著三駒關係的方法快速變強後,也用了很多不同的手法來改良。但圍棋軟體無法靠著人類使用很多的小改良來大幅提升棋力,此時剛好深度學習法出現,非常適合圍棋AI使用。於是就開始走上和將棋AI不同的發展方向了。


採訪:將棋軟體是使用CPU來計算,圍棋則是從AlphaGo出現以來,就變成了使用GPU對嗎?


大橋:沒錯。深度學習一般是使用GPU沒錯。不過Google公司卻為了AlphaGo開發出了AI專用的GPU。和李世石先生對戰時,就已經是使用TPU了。不過現在TPU這種東西,也只有Google公司才有....。


採訪:所以只好改用GPU代替對吧?不過聽說大橋老師打算購入GPU的時候,卻發現住的公寓電流數不夠對嗎?(笑)


大橋:對對對!哎呀,當時我才剛搬家的說。沒想到新公寓竟然電流負荷不足...。


採訪:又不能再搬家是吧(笑)


大橋:當時是流行使用GTX1080Ti這顆GPU,現在也有熱心於AI的棋士改用RTX2080Ti等GPU。再加上現在又出了RTX3080或3090等新GPU,所以現在的狀況是大家都打算改買這些新產品。


採訪:開發將棋軟體的屋根裏王(やねうら王,暫譯)的磯崎先生就很推薦RTX3090,而實際上開發水匠這個匠棋軟體的杉村先生也買了這顆GPU。然後他就用這個開發了深度學習版的水匠。不過,圍棋職業棋士中,會去購買GPU來跑的人很多嗎?


大橋:目前為止,有買GPU的人還蠻多的。


採訪:將棋的藤井聰太老師在接受專訪時說他也購買了高性能的CPU,一面小心注意控制溫度、一面在自己家中去跑將棋軟體。


大橋:喔!果然厲害。


採訪:圍棋界中會這樣做的,應該也很多吧?


大橋:沒錯。現在新秀棋士們最喜歡聊的就是「要不要裝兩顆GPU」之類的話題呢。


採訪:裝兩顆高性能的GPU嗎?!這樣不會擔心電流不夠的問題嗎?


大橋:不過,我想這種情形未來還會再改變吧。


===


相關系列文章:

沒有留言:

張貼留言