呆大非叫獸的文抄公資料庫: 勝間史朗談阿發夠（３）

2016年4月24日星期日

勝間史朗談阿發夠（３）

第三章職業棋士看AlphaGo的棋力

這裡我要說說我的兩點看法。第一點是為何李世石九段會輸掉，另一點則是關於圍棋的特徵。

首先，就是為何像李世石九段這樣的人類會輸：就像前面兩章所言，AlphaGo是利用統計分析，會一直去資料庫觀看至今為止人類所下過的棋譜，然後搜尋出現出現機率最高的棋形，並且一一將之群組化，然後導出可以獲勝的最終圖面。然而這個過程中，其每一手選擇的都是「普通的棋」，換句話說，就是一直持續下著不好也不壞之棋的意思。另一方面，身為人類的李世石九段當然是有可能下出比「普通的棋」糟糕的著手，而他就會在那一瞬間輸掉。

不過，人類還是有不輸給電腦的地方。就是大局觀、與厚薄的價值判斷。

就像目前為止我們所討論過的一樣，AlphaGo並不是因為知道某個落點是好棋才去下的，它只是根據統計上出現最多的下法落子而已。因此就算是出現了以人類的角度來看是接近９０%機率的好棋，但因為它根本不懂厚勢的價值與感覺，最後還是會因為無法進行大局觀的善惡判斷而不得不被人類擊敗。

這裡我們就以AlphaGo和李世石所下的第四局為例來說明這種狀況吧：

４圖

４圖是AlphaGo下出８３手時的局面，也是白棋下出白▲好手以技巧打開局面之後的瞬間。

然而此時形勢還是黑好，因此此刻它要是有大局觀的話，就該走黑１到黑７的下法，如此還是持黑的AlphaGo獲勝吧。

AlphaGo是從棋譜資料庫搜尋中導出「局部的棋型」，然後透過一層一層的群組化，並且將這些群組填入盤上作出終局圖，這是它厲害的地方。

然而，這和人類會搭配大局觀來使用棋型的思考方式是完全相反的，所以遇上需要使用大局觀來決定勝負的場面時，就會是人類占上風；相反地，如果是根據統計做出來的「棋子型態」來一決高下時，就會是AlphaGo贏棋了。

有趣的是，這場五局賽對決的一到三局，李世石九段事前似乎是某種意義上誤解了AlphaGo是參考過去的棋譜資料庫來決定著手的情報，而故意下一些資料庫中沒有的棋，反而成為了他的敗因。事實上AlphaGo是根據局部的棋型進行統計來下棋，因此就算是過去沒有前例的棋，它也一樣可以確實地接應無誤。

不過，我們還是可以感覺到李世石九段透過過去三局的經驗有體會出甚麼東西，所以一反前三局的態度，而從第四局開始切換成「以大局觀來決勝」的下法。

正是這樣，他才能在第四局中獲勝。

其實，第五局他也是打算維持「以大局觀來決勝」的戰略，但卻在接近官子階段時輸給了計算精度越來越高的電腦；所以這盤第五局在意義上或許可以說是人類真正輸掉了也不一定。

總之，這是獲得了接近職業棋士思考方式的AlphaGo、與贏過使用人工智能的電腦程式知李世石九段各自發揮其長處而表演出來的五局好棋。

此外，我也想以專家棋士的身分來談一談圍棋的特徵。

我就以５圖這個引起話題的第二局黑３７這手肩衝為例來說明之。

５圖

下出這手「職業棋士不會考慮的棋」，讓電腦堂堂超越了職業棋士而成為話題；但是就圍棋的特徵來說，常常會出現在局面明朗之前、不管下在哪裡結果都不會有太大區別的狀況。

因此在此局面中，不僅是黑１（３７）這手棋，就算黑棋下在Ａ、Ｂ、Ｃ等三個落點，也都是一局棋。

在這些落點中，應該會有很多職業棋士選擇既是勝率比較高、又是「成為好棋可能性較高」的Ａ或Ｃ吧。

然而，AlphaGo從過去的統計搜尋中挑出黑１這手棋的理由，可以推測是黑１下出來後，白棋的應手只有Ｄ或Ｅ兩種選擇，而且之後的進行都已經群組化學習過了，所以它才挑選黑１這個最容易搜尋出來的結果。這也可以說是它未必會挑選最佳著手的一個例子。

但是職業棋士有選擇「成為好棋可能性較高的棋」而不是「不好不壞的棋」的傾向，所以黑１這手棋根本就不會放到他們的選項之中。

只不過，只要是對手接應正確，則就算是下出「成為好棋可能性較高的棋」，可能仍然和黑１一樣變成不好不壞的結果。

這也是人類彼此對弈的思考與電腦之思考不同之處。

我覺得我們職業棋士必須重新認識的一點，其實反而是黑１這手棋是不好不壞之棋吧。但是，這也是職業棋士不會選擇的棋。

如果能夠掌握到這個特徵，也許可以找出今後圍棋愛好者們新的看棋樂趣呢。

至於下一章的最終章，我就想來談談這個新的樂趣之部分。

＝＝＝

相關系列文章：

呆大非叫獸的文抄公資料庫

網頁

2016年4月24日星期日

勝間史朗談阿發夠（３）

沒有留言:

張貼留言

網頁

2016年4月24日 星期日

勝間史朗談阿發夠（３）

沒有留言:

張貼留言

2016年4月24日星期日