雷蒙:
AlphaGo在第四局的敗因,有不少意見認為是出現蒙地卡羅運算法的弱點造成的。只不過,開發團隊的程式師卻否認了。
大橋:
怎麼說?
雷蒙:
開發團隊中有人認為可能是類神經網路的盲點。從那一著白78之後的發展來看,我是第一次看到AlphaGo開發團隊程式師們顯現出認真的表情。終局之後,雖然我還是照例進行全局的精華解說,但只有那一局有一堆程式師在等著我,一直在問我那那裏應該怎麼下才對。從這裡也可以看出他們興奮研究的樣子。
王:
第四局雖然出現了一些奇怪的著手,但對AI來說,它只是照著普通的下法去下而已。過去的圍棋程式是一旦局面變差,就會變成完全不成棋般的亂下,但是第四局卻是直到投降之前,都還是盤面輸贏的程度。其品質水準很明顯比以往的圍棋程式好很多。真正的問題是出在出棋的瞬間,黑棋形勢並沒有到那麼糟糕,結果電腦卻誤判為形勢很差。我想真正的盲點恐怕就是在這個誤判上吧?
雷蒙:
我聽說當時電腦是判定勝率非常的低。據他們說,只要是電腦判斷勝率低於40~45%左右,就可能會出現錯誤的下法。
王:
那真是個很大的錯誤判定。顯然此處就有改良的餘地吧。我想開發團隊的程式師一定很清楚發生誤判的原因,現在可能正在進行改良吧。我覺得從經驗上來看,蒙地卡羅法的弱點應該也還在AlphaGo中存在才對。
大橋:
怎樣的弱點?
王:
主要的三個弱點就是「不擅長計算長手數的變化」、「無法區分局部與全局的差異」、「局面稍微變差就無法忍耐而抓狂」(譯註:再度證明羅洗河九段的說法正確)。只不過,就算避開這三種弱點來下一樣可以獲勝,就是AlphaGo厲害的地方。
大橋:
光從這點來看,就知道圍棋有多麼的博大精深。
王:
最先我看到AlphaGo的棋譜時,就感覺到它很明顯比我強。然而李世石先生也比我強,所以我覺得這場五局賽可能是平分秋色。但後來又聽說它還是有用蒙地卡羅法,就覺得它不可能懷有弱點還贏棋,於是我的預測就從「平分秋色」轉變成「不知道它能和李世石先生戰到甚麼程度」了。
雷蒙:
在現場,媒體也開始追問如果要在醫療或自動駕駛的領域應用AI的話,是否可以相信犯下那麼嚴重失誤的AI?對於這個問題Google方面好像也沒法好好的辯解。
王:
我覺得從這個角度來看,Google公司一定會去修正這個問題。
大橋:
剛才王銘琬老師說AlphaGo很不擅長計算長手數的變化?
王:
最長了不起就是算個十手左右吧?
雷蒙:
啊?這麼不會算啊?
大橋:
聽說是沒辦法做正確的長手數計算的樣子。第五局黑53起出現的大頭鬼棄子絞封的手法(如圖C),它就算不出來。
圖C
王:
第三局中AlphaGo在圖D的局面下了白1擋,結果變成了劫爭,但此處白棋明明只要於2位點入就可以無條件淨吃了。此局最後的結果雖然是AlphaGo贏了。但我看起來,就是AlphaGo算不出變化而著手混亂了。我想李世石先生一定也是從此處的接應判斷出來AlphaGo不擅長計算,而間接關係到第四局那一著挖手的出現吧?
圖D
大橋:
也有AlphaGo在中央戰鬥的計算比較弱的說法出現。
王:
這我就不知道了。不過,過去採用蒙地卡羅演算法的圍棋軟體反而是靠盤端的計算比較弱。我們職業棋士很清楚明白的棋它卻往往不懂,這就是人類與過往圍棋程式出現差距的地方。
雷蒙:
感覺上在去年十月它和樊麾二段下的五局賽中,惡手也幾乎都是出現在盤面的第一線或第二線之處。
王:
但是到了中央出現不得不去算清變化的場面時,它也是會出現變弱的特性來。
大橋:
我對電腦程式的印象就是大局觀很強,但局部的細算很弱。
王:
「細算」其實是我們人類的概念。只不過,我覺得AlphaGo卻能看出就算不細算也能獲勝的手段。
大橋:
我個人覺得圍棋這種遊戲是當實力相近的對手來下時,才會刻意朝複雜化的方向發展。因此老實說,我覺得AlphaGo其實是比李世石九段要強的。雖然AlphaGo的確有我們前面討論的那些弱點在,但同時也讓我感受到它具有不讓我們看到弱點來下棋的實力差距。倒過來說,如果今後出現了具有AlphaGo同等以上實力的人類或是其他圍棋程式來和AlphaGo對局,則其弱點就會清楚地顯露出來。現在看起來它是藉著佈局領先而跑在前面不讓人類追上獲勝,但如果其內在還是存在這些弱點就跑去應用到醫療等其領域上的話,將會是件非常危險的事情。
雷蒙:
此外,使用蒙地卡羅演算法的圍棋程式很不擅長在大模樣中做活(譯註:或者該說是善攻拙守),不知道這方面AlphaGo的程度如何?
大橋:
這次的五局賽李九段常常很刻意地去走撈實地的下法,真希望他當時也能走一些規模雄大的棋給大家看看。
王:
我也贊同剛才大橋先生的意見,但這個推論沒有實際下過還是無法知道真相如何。之所以如此,是因為李世石先生或AlphaGo都比我自己強,所以我也就不知道他們之間棋力有沒有差距。
===
相關系列文章:
沒有留言:
張貼留言