2019年4月6日 星期六

圍棋AI與AWS


譯自:IT Media

順著圍棋AI熱潮,在新秀棋士之間非常流行使用「AWS」,其理由為何?

~大橋拓文六段專訪

[前言]

在這幾年,在將棋或圍棋這種盤上遊戲的世界中可以看到AI(人工智能)的能力持續超越了人類。特別是隸屬Alphabet(Google)集團底下的Deepmind公司所開發的圍棋AI阿發夠,接二連三地擊敗了世界頂尖級的職業棋士,而成為現今的人工智能熱潮點起了第一道火苗,而讓人記憶猶新。

也是這樣,最近職業棋士們也開始使用AI來進行圍棋研究,在這樣的影響下,年輕的職業棋士們開始使用AWS(Amazon Web Service)的人急速增加起來,其原因到底為何?

AI超越人類的時間點,比預期早三十年到來

挑起這個AWS風潮的,就是大橋拓文六段。他本來就以熱心研究如何活用電腦圍棋而著名,甚至也出版了圍棋AI的解說專書「了解圍棋AI大全」。大橋先生開始對圍棋AI感興趣是在2010年左右,當時還是完全無法想像AI可以戰勝職業棋士的狀態。

大橋先生說:「本來我是打算將AI當作我老了以後的興趣來開始研究的。因為我認為要到我退休左右,AI才可能超越人類。結果這比我的想像早了三十年就到來...。當時圍棋AI因為採用『蒙地卡羅法』而開始有了棋力的重大突破,甚至到了業餘高段左右的棋力」。

所謂的蒙地卡羅法,是使用亂數來進行反覆的龐大演算(模擬),而根據模擬結果找出機率的一種方法。對於圍棋來說,就是利用這種手法來計算出「下出這手棋可以獲勝的機率」。從當時起,法國、台灣與日本都有很多開發者來研究,所以電氣通信大學也開辦了讓各程式間進行對戰的比賽。

大橋先生也在這個比賽中登場,和各參賽者進行對於AI著手善惡的意見交換。大橋先生說:「從蒙地卡羅時代開始,我就從各開發者身上學到了很多東西」。從那開始的數年間,都是由大橋先生擔任與AI進行對戰的實驗對局或解說的重責大任,而和很多的AI研究者建立了良好的關係。

不過蒙地卡羅法雖然帶來了圍棋AI的突破,但在那之後AI的研究就遇到了瓶頸。在AI很能再變強的狀況下,甚至讓大家開始考慮「AI可能也需要小休息吧?」。然而,從2015年末開始圍棋AI的發展狀況為之一變,沒錯,因為阿發夠登場了。

「看到論文時,興奮到睡不著」 阿發夠所帶來的衝擊

當阿發夠發表時,馬上就看起其論文的大橋先生說:「我興奮到睡不著」。隨著論文發表的同時,也公布了阿發夠對頂尖職業棋士的對戰棋譜,當時大橋先生的直覺是「說不定世界冠軍級的職業棋士可能也會很危險」。就在那之後,阿發夠也真的以四勝一敗的成績擊敗了世界最強棋士之一的李世石九段;一年之後,它也擊敗了世界排名第一的柯潔九段。

在那之後,就連大學中也急速增加了很多阿發夠或深度學習(Deep Learning)的研究會。大橋先生也開始接收到了以「人工智能學會」學會誌為首的許多邀稿與演講機會。大橋先生說他原本就是看到「數學公式就會很興奮」的人,而很喜歡數學,所以他也一面和各種資料進行奮鬥、漸漸地對AI的理解也越來越深。他說:「這些演講和執筆的機會,對我來說就是最棒的學習環境」。

自從AI開始完勝頂尖棋士之後,棋士之間活用AI來進行研究的方法也跟著推廣了出去。現在圍棋的AI除了阿發夠(現在最新版是阿發夠.零)外,還有臉書的「ELF Open GO」、中國騰訊的「絕藝」、比利時的OSS社群所開發的「Leela Zero」等十數種程式。最近,使用Leela Zero的圍棋GUI(圖形使用介面)「Lizzie」也出現了,這讓大家檢討AI所下出來的棋路或直接與之對戰也變得更加容易了。

配合Lizzie的出現,大橋先生也開始打算在自己家中設置一套能跑圍棋AI的電腦系統。一開始他是打算買一台能夠裝上兩片GPU的桌上型電腦,但買了這台電腦後卻發生了一項意外(?)。就是他家所簽約的電力公司能提供的電流數不足以負擔這台電腦需要的電量,讓他發覺他一但要開始跑AI時,家裡就會停電。

大橋先生說:「當時我才剛搬家沒多久(譯註:應該是因為新婚的關係),所以我也很猶豫是不是要跟房東太太討論提升電量的問題...。所以在家跑AI的計畫就先擱置下來。結果在我去北京參加騰訊主辦的圍棋比賽時,我認識的圍棋AI開發者就推薦我使用AWS。使用AWS的好處就是我也不需要有甚麼初期投資,也不用擔心GPU會有過熱的問題(笑);所以我就想馬上開始用用看」。

於是大橋先生就從2018年7月起開始使用AWS。一開始當然滿滿都是不懂的地方,後來加入了東京目黑區的AWS開發者討論空間「AWS Loft Tokyo」,透過ASK單元來提出許多問題、並且又和很多開發者進行討論,也得到了建立Amazon圍棋社團、負責Spot Instance(註)的社團社長之建議,讓大橋先生使用AWS的費用大幅降低。根據他的說法,現在「大約一個月用幾千日圓到一萬日圓左右就夠了」。

註:Spot Instance(執行個體)是一種Amazon EC2的功能。就是讓AWS伺服器上沒在使用<或說是多餘>的EC2 Instance,透過競標的方式來暫時使用。這個方法可能會因為有人出價比你高時,就會讓你的使用馬上被中斷的風險,但整體來說,其價格還是比正式「配合需求」制的使用方式平均便宜七~九成。

發起AI研究會、讓新秀棋士也紛紛開始建立起AWS帳號

使用AWS逐漸上軌道的大橋先生,接下來也開始考慮要成立研究會。因為只要有一台筆記型電腦與網路的話,透過AWS就可以在任何地方利用AI來研究圍棋。因此他就利用這樣的優勢,在日本棋院的本院(東京市谷)創設了定期的活用AI研究會「Project AI」。現在成員是以十幾歲到三十幾歲的新秀棋士為中心,增加到了大約25人左右。

大橋先生說:「只要家中有台高檔的AI系統的話,其實一個人就能在家進行圍棋研究,所以現在聽說中國或韓國慢慢出現了圍棋棋士『在家閉關』的問題。不過,其實AI下出來的棋,還是常常會出現獨自一人很難理解透徹的狀況,所以我還是覺得需要有個能讓棋士們互相合作研究的場所比較好。而且雖說圍棋AI已經超越了人類,但也還是常有連AI都很難分析出來的局面。對於這樣的部分,就更需要人類彼此之間合作來探索最好的下法了」。

而且大橋先生在熟識的開發者幫助下,幾乎所有的圍棋AI都會使用了。大橋先生如果要更新圍棋AI最新版本時,就會用「AMI(Amazon Machine Image,Instance的軟體設定)」這樣的共享系統,透過Line來通知研究會的會員。要啟動圍棋AI時,會在Amazon EC2上跑,如果會用到GPU時,則是用P2/P3 Instance來跑。

大橋先生說:「P3雖然比P2貴三倍,但同時間內可以搜尋出來的步數卻是五倍以上,所以考慮到性價比下,現在使用P3的人也越來越多。不過,大家更期待後續會出更快更便宜的Instance吧」。

參加這個研究會的職業棋士,當然都是AWS的「外行人」。不過以大橋先生為首的棋士,會對使用AWS系統有興趣的成員幫忙進行初期設定、並且教大家使用;後來甚至有整理出AWS使用方法的職業棋士出現,所以現在所有的成員都能靠自己使用AWS的Instance了。

大橋先生說:「其實我們的研究會中也有七十幾歲的前輩(譯註:林海峰國手?),現在也已經是所有人都建了自己的Instance了。這些都是對於圍棋的求知慾所帶來的原動力。而且後來也出現對於AWS很感興趣的人,他們不只會用AWS的各種設定,最近還做出了性能的比較表出來。其實我們的成員,也有除了AWS以外在使用GCP(Google Cloud Platform)的人。由於他們是開發出TPU而讓圍棋AI有重大突破的公司,所以我個人也對GCP很感興趣」。

研究會的成員中也有不少人是學生兼職業棋士。所以我們請教了有另外參加學習會、被大家期待是後井山時代領軍者的一力遼八段,他說:「感覺上我又添增了一項新的工具」。對這些新秀來說,AI已經是一種特別的存在了。大橋先生說:「特別是年輕人,因為AI的緣故,開始改變了他們對圍棋的想法與對話方式」。

用AI來改變圍棋文化 未來將是「人機一體」的時代

「這手棋應該是藍色吧?」、「不,恐怕是綠色?」、「下成這樣的話,就變成了『蕁麻疹』了」。

最近利用AI來研究的年輕棋士之間,出現以上這種對話可說是家常便飯。所謂的「藍色」就是Lizzie上顯現的「AI第一候選落點(最佳落點)」。這是因為AI推薦這個落點時,會出現藍色的閃光。而綠色則是AI的第二候選落點。

所謂的「蕁麻疹」,則是找不到很有力的候選落點,AI進入了全力搜索模式時,棋盤上的各個點全部都顯示成勝率數字的狀態。根據AI程式的舉動(或規格變化),棋士們的會話也會跟著不同,這點讓人覺得非常有意思。

大橋先生說:「其實大家對於形勢判斷的想法也都改變了。圍棋其實是一種黑方白方彼此圍地比輸贏的遊戲,因此過去進行形勢判斷時,一般都是以表是陣地大小的『目數』來進行討論。

不過現在圍棋AI則是用『下了這手棋後勝率會是多少?』的方式來判斷。因此形勢判斷也從相差『幾目』變成了相差『幾%』,想法都不一樣了。我的印象是,對於這種觀念的變化不加抗拒而直接接受的人,通常也都是比較會活用AI研究的人。」

大橋先生接著說:「今後人類不是要和AI對抗,而是巧妙的使用AI來達成『人機一體』的時代」。就連將棋的世界,也因為AI普及的關係,產生出了「叡王戰」這樣的新頭銜賽(DWANGO公司舉辦,現在停止了純人類和電腦將棋軟體的對局),未來也希望能出現人類與圍棋AI共同合作下棋的比賽或頭銜賽。

大橋先生說:「為了建立起和AI合作的關係,我的目標是希望讓雲端服務或GPU的供應商來舉辦比賽。由於AI的普及,造成圍棋的定石持續發生變化的關係,會讓人甚至想不起來三年前我自己到底是下甚麼棋路了。

現在要能判斷出AI下的棋是甚麼意義,還是需要職業級的棋力,但我相信這種『理解的障礙』早晚也會被消弭掉,所以包含在業餘棋友在內,大家的視野都會更加廣闊。在研究會上,大家會一面嘗試錯誤、一面找出『人類的新價值』。就這個意義來看,人類和AI合作的比賽,可以提供出一種新的可能性吧」。

沒有留言:

張貼留言