2017年7月3日 星期一

阿發夠自戰譜徹底分析會整理(1)


如題,這也是你摳你摳特別策劃的節目,除了搭一下阿發夠的順風車外,多少也有幫忙打書的用意在,算是招一舉多得的好棋。播出的時間是6/12日的晚上,由於這個時段是我固定看連續劇的時間,所以是以「時光機」預錄的方式收看。

節目的組成,是由王銘琬九段掛頭牌,大橋拓文六段擔任「男二」,而由下坂人妻負責主持與提問,也差不多是你摳你摳能端出來的討論AI的最佳黃金陣容了。

最上道的你摳你摳,當然會在現場放一下王老師的新書囉(日文版)

主持經驗很豐富、說話也很機靈的下坂人妻一上來就稱讚兩位主角:(在日本)說到AI圍棋,就是兩位了 :)

不過,兩位主角突然被稱讚到,反而不知道怎麼反應,只能傻笑。


過了半晌,王老師回過神來,補上一句:AI的範圍領域很廣,絕對不會是只有我們兩人而已啦。

下:不管怎麼說,還是請兩位當AI專家的代表,在現場和我們的觀眾熱烈討論吧。

下:今天的主題,是在和柯潔比完三局賽後,DeepMind公司所公布出來的阿發夠自戰對局譜。之前柯潔雖然是三戰全敗,但他是號稱最強的人類棋士呢。

王:沒錯,他是地位不可動搖的世界排名第一。

下:但三連勝的阿發夠,卻也宣稱從此退休,不再參加比賽....。啊,說到這裡,這次的阿柯三局大戰是在中國舉行,而兩位也去了現場觀戰對嗎?

王:對,我是單純去學習的,但旁邊的這位就好像不是了(笑)

大橋(露出不要害我的表情):我是去幫忙你家水管的轉播解說啦。說是去轉播,但會場很大,很多不同的房間....

下:我想現場一定有很多八卦可以說,等下可能也要麻煩兩位跟我們聊一聊。

王:會場真的很大,雖然在主要的大廳有主要的大棋盤解說,但其他的檢討與轉播就在其他的房間中。

大:對,我就在相當於棋盤右下角二二位置的小房間中轉播解說(笑)。

下:阿發夠從去年三月出來和李世石九段比賽,到現在也有一年多了,其實力真的有進步這麼多嗎?

大:大家也都說是進步非常多啦...但到底強了多少,誰也不知道。所以我們今天才會在這裡弄個徹底分析的節目。

王:雖然DeepMind公司根據內部對戰的圖表與排名系統分析,認為最新版本的阿發夠比去年強了三子,但他們也解釋這只是一種數值的比較,未必代表真的相差三子。救我來看,阿發夠的變化在本質上也沒有那麼大的不同。只能說它真的是變強很多。

下:在這五十局公布的當天,我就看了一些。但內容上看不懂的地方太多,就會有種因為太難而敬而遠之的心態出現,乾脆就不想看了....。不知道兩位在看這五十局時的心境是怎麼樣?

王:我也是在公布的當天,就看了那十局。其實我在看這些棋之前就有個疑慮---萬一其中一方走東坡棋怎麼辦?萬一看到的棋譜都是東坡棋,可就傷腦筋了。

大橋、下坂齊聲大笑。

王:結果沒有東坡棋出現,我就放心了(笑)。不過呢,我們以往看到的棋譜,都是不同的對手互相下出來的棋(其實黃龍士等中國棋士也有自擬譜),而圍棋也會因為不同的個性碰撞出火花。但這次是相同的機器下出來的棋,所以彼此的風格會非常像,這也是沒辦法的事。

大:也是這樣,王老師才會擔心會有東坡棋的出現,因為兩個阿發夠就像是鏡子的裡外兩面,是互相對稱的。

下:今天的節目內容我們也檢討了很久,所以我就先問兩位,今天的徹底檢討中,打算討論怎樣的主題?

大:我們是覺得從某些點去切入來看棋譜,可能會比較讓大家理解吧?

王:下坂女士有沒有甚麼特別想看的地方,我們就從那裏開始?(笑)
(這種調戲助講的手法,在你摳你摳中簡直變成公式了 XD)

下:怎麼這樣,人家完全沒有想過啦....我對這五十局的內容完全不熟,還是請兩位老師來決定就好。

王:其實我們開始看這些棋時,要去理解其內容也是非常困難的。到現在為止,雖然還是不太懂,但至少是看習慣了。也是這樣,它的一些手法,也已經在正式比賽中被拿出來使用了。但有一點是我覺得很重要的事,以前我們打譜,是想把其中的內容拿來當範本。但我覺得現在這五十局棋譜,可就不能拿來當作我們下棋的範本。這些自戰譜,因為棋力太高,而且和自己的想法是衝突的,可能也學不起來。不如拿這些棋譜中的局面來思考自己會怎麼下,反而比較有意義。

大:特別是在人類出現的這幾千年、幾萬年間,絕對不可能出現另一個和自己完全一樣的人;所以在人類社會中,性格不合發生衝突才是常態。如果是在雙方完全互相理解的狀況下去下棋,可能會因為太過意識到對方,反而會下出損失很嚴重的棋。所以這種棋不用太常擺會比較好。

王:其實也還是說,去學阿發夠自戰譜裡面的棋是很危險的事吧。(笑)

下:另外,我也想請教兩位,對於AI圍棋裡面最感興趣的地方?

王:我是從電腦圍棋導入蒙地卡羅法開始,就對這個領域非常感興趣。因為我覺得蒙地卡羅法的邏輯,和我下棋的想法很接近。所以我就在想如果把我的圍棋知識加入電腦圍棋之中,應該會很有用才對。但進入深度學習法時代後,就我的這些圍棋知識套入到程式之中,到底能不能讓圍棋程式變強,就有疑問了。所以雖然阿發夠宣稱已經不再參加比賽了,我還是會想和其他的AI程式合作,看看其中會有些甚麼突破。

下:本來王老師的空壓戰法就是很獨特的想法了。

王:其實我這個空壓戰法的內在精神就是因為算不清,所以想利用機率概論的方式來找出落點。所以我才會覺得我的這個想法能夠幫助蒙地卡羅時代的圍棋程式。也可以說,這是一種利用期待值的方式來下棋。

趁著這個時機,機靈的下坂開始幫忙王老師推銷新書。這段打書的部分,基本上和王老師回國宣傳時說的東西差不多,這裡就先省略了。

下:那大橋六段,你對AI的甚麼地方感興趣?

大:其實我就是單純覺得有趣而已(笑)。後來在2012年剛好有了和店長合作檢討棋局的機會,然後就寫了五、六年的專欄。

王:其實接下來你也要出新書了對嗎?

下:對,這是一本叫做「AI圍棋時代的新佈局法」的書。

大(笑):這本書是想告訴大家,在看了AI的手法後,人類還是可以從中創造一些新手法的。(預計七月上市)

===





相關系列文章: