2016年5月18日 星期三

狂石深度學習版測試文


2016年5月16日

本來今天得要再多一點實驗的,但剛好今天是「狂石深度學習第一版(Crazy Stone Deep Learning The First Edition)」的發售日,讓我完全抵擋不住想要嘗試這程式的誘惑啊(笑)。
結果,我分別持黑白下了兩局,都是完敗。設定是限時30分鐘+讀秒30秒,使用的機器是Core i7(四核)CPU的筆記型電腦。

哎呀,這程式真是非常厲害啊。然後,我才發現我的棋力真的非常弱啊(淚)。對局中是可以看到棋盤下的形勢表(我還沒試過可不可以關掉這個表),我就看到從佈局階段開始一直都是電腦方以強大的氣勢維持著優勢...。讓我有種「沒想到會輸到這種程度...」的感覺。

老實說,棋譜的內容實在是太丟臉,所以我就沒有存檔。今後萬一我可以下贏電腦的話,我再來上傳棋譜好了。

以前我去參加比賽時遇上業餘高手,也很難會被修理到這樣七零八落的程度啊...。不知道是這一版的狂石比以前那些業餘高手強?還是至今為止我根本就沒讓那些跟我下過的業餘高手拿出全力來跟我下啊?


2016年5月17日

今天我首度贏了「狂石深度學習第一版」!

昨天在寫完部落格之後,又想挑戰看看「圍棋AI好像對佈局不太擅長」的說法,結果又是完敗,讓我不得不認為「恐怕我一輩子都贏不了電腦」了。不過,這盤卻是暴露出「一般的蒙地卡羅演算法圍棋軟體看不懂角上死活」的弱點,讓我幸運地獲勝。

此外,對局設定還是限時30分鐘+讀秒30秒,使用的機器也還是Core i7(四核)CPU的筆記型電腦,然後利用程式的「猜子」功能決定先後,結果是我持白。

以下是棋譜的連結。棋譜是以黑棋角度來看的方向來保存的。

棋譜再生


這套軟體有所謂的「分析(Analyze)」功能,可以用來詳細理解電腦是怎麼判斷形勢的,因此我就一面看著電腦分析的內容一面來回顧這盤棋吧。

  • 白8我考慮的是:「如果我去搶實地,被電腦單方面佈起大模樣的話,恐怕會很難獲勝。必須下成雙方都是以模樣對峙,誘敵深入攻擊」。不過要是黑9夾擊過來的話,搞不好很難走成我想要的這種發展。
  • 白12跳時,黑13的應法可能會是在沒有黑5、白6交換時可以考慮的一種下法,但在有此交換的場合下,我覺得是黑棋稍稍不利。
  • 白30防斷後,覺得還算是下得馬馬虎虎。
  • 到黑49為止,雙方在左邊的攻防算是告一段落,狂石認為此刻的形勢大致是平分秋色。下到這一盤為止,我還沒看到我下了幾十手之後還能一直和電腦維持均勢的狀況呢。
  • 白下64是想挑黑63的毛病,但從此處開始狂石是認為黑棋變得稍稍領先了。
  • 白88雖然是非常勉強的薄棋,但我覺得也只能這樣下了。從此處開始狂石認為黑棋是明顯優勢了。
  • 白下98、100時是陷入苦戰的狀況,但這裡我有「如果電腦輕視角上的劫爭的話,或者會有轉機...」的期待。
  • 黑101開始雙方開始脫離右下戰線亂鬥(汗)。
  • 我覺得黑121是完全脫離戰場了,但狂石覺得此刻黑棋的勝率已經到了75%了。但就在這之後勝率就開始一直往下跌了。
  • 白122點入後的接應,我覺得黑棋是完全下錯了。但是即便到白128為止,狂石的勝率卻還沒有掉那麼多,我猜應該是電腦算不出周圍黑白的攻殺狀況吧。
  • 看起來電腦也不知道白148是對角上黑棋的先手。
  • 到白208為止,白棋完全活定,而左下角黑棋是盤角曲四的死棋,至此我才確信獲勝。但是到了白236為止,狂石都還一直認為是它自己優勢呢。

總之,「狂石深度學習第一版」的確是非常強,但從此局中也知道了它有這樣的弱點。我想恐怕AlphaGo也有同樣的弱點吧?不過它公開出來的棋譜實在太少,所以無法清楚判斷是否如此。雖然它在KGS或東洋上都有帳號,但除了開發者本身以外,是一局也沒下過的樣子。雖然疑似有讓東洋上的「deepmind」出來下棋的情形,但實情是怎樣也是不得而知。

不過不管怎麼說,還是希望我自己不要像這次以「針對圍棋AI弱點」的方式,而是一般正統的下法下贏「狂石深度學習第一版」啊(笑)。

===

荒木伸夫簡歷:
東京大學理學院資訊系(理學部情報科學科)、研究所畢業,曾加入G-Search(富士通子公司)工作,現於電氣通信大學研究所資訊、通訊工程所攻讀博士,並且成為日本學術振興會特別研究員。棋力5~6d。