呆大非叫獸的文抄公資料庫: 勝間史朗談阿發夠（１）

譯自：日本關西棋院官網

職業棋士看AlphaGo之實力

～何謂深度學習（Deep Learning）

執筆：關西棋院勝間史朗七段

第一章　何謂深度學習？

阿發夠能獲勝的關鍵原因，就是使用了深度學習的思考手法；所以如果能搞懂何謂深度學習，就可以明白阿發夠的實力。

因此，首先就從這種手法開始講起吧。

所謂深度學習，簡單一句話，就是只抽出我們想知道的特徵，然後從過去的學習資料庫當中，再搜尋出符合這種特徵答案的學習手法。

以圍棋的狀況而言，就是當想要找出能夠獲勝的次一手時，需要先試著做出各種變化衍伸出來的終局圖，接著就必須決定接下來要選擇哪一種變化。但是這些變化的數量可說是天文數字，因此至今為止要這麼做是很有困難的。

然而，使用深度學習的手法時，只要在局部棋子的折衝中，抽出特徵性的型態、排除太多的多餘變化，然後就能精簡地做出各種終局圖。也因此，達成棋力上的飛躍性進步。

在此，為了讓這種只抽出特徵、據此模擬出棋局後續發展的思考手法簡明易懂起來，我就以一個假想的網路翻譯軟體來舉例，讓大家能夠有個清楚的印象：

當看到「I Love You」這句話而進行翻譯時，如果用機械式的翻譯，就會變成「我．愛．你（わたし愛してるあなた）」（譯註：在中文裡這樣直譯並無問題，因為中文和英文的文法都是主詞＋動詞＋受詞的結構，但日語的文法結構卻不是這樣。因此如果直譯的話，會變成「わたし愛してるあなた」，不符合日語受詞要放在動詞前面的用法，反而是錯的；所以作者特別舉這個直譯錯誤當例子），但如果使用統計手法，就會發現網路資料庫中「我（私）」這個字之後有６０％的機率會接「是（は）」這個字，剩下的３０％中則是「乃（が）」（譯註：其實通常が也是翻成「是」，但在日文中は、が是有差異的，所以我在這裡故意翻成乃）；因此從統計與機率的分析來看，就會把「我是（私は）」當作一個群組來使用，就好像圍棋中的定石一樣會連結出現。

以上這個分析，就是抽出特徵流程的第一步。

同樣地，在「你（あなた）」之後，通常會跟著「把（を）」、「對（に）」、「乃（が）」這些助詞出現，因此也各自歸類成群組。

於是，這句英文的翻譯就可以稍稍進步成把「I」翻成「我（私は）」而「You」翻成「你（あなたが）」這種群組式的預期翻譯，而進入第二步的思考程序。

於是原本翻成「我．愛．你（わたし愛してるあなた）」的句子，就會進步成「我．愛你（私は愛してるあなたが）」了。

接下來再次利用統計與機率，會發現網路上「我（私は）」這個群組之後會有５５％的機會出現「把你（あなたを）」這個群組，或者有４０％的機率出現「對你（あなたに）」．．．也就是可以找到許多不同的群組組合。所以我們可以再把「我把你（あなたを）」、「我對你（あなたに）」編成新的群組。如此再進一步翻譯下去，就會把「我．愛．你」變成了「我對你有愛（私はあなたに愛してる）」而導出更加群組化的結果。

於是再使用統計與機率，會發現網路上有１０％的機率會將「I Love You」表示成「我對你有愛（私はあなたに愛してる）」，但有９０％的機率則是表示成「我愛你（私はあなたを愛してる）」，於是程式就會將搜尋機率最高的結果當作翻譯答案顯示給使用者看。

最後，程式根本就會把「I Love You」的翻譯「我愛你（私はあなたを愛してる）」分類成一個片語、儲存在資料庫中，而「學習」起來。

像這樣從第一步到第二、三步是一層層深入思考的方式，就是這種方法被稱為「深度學習」的原因。

至於該怎麼使用這種手法應用到圍棋上，就待下一章見分曉囉。

＝＝＝

相關系列文章：

呆大非叫獸的文抄公資料庫

網頁

2016年4月22日星期五

勝間史朗談阿發夠（１）

沒有留言:

張貼留言

網頁

2016年4月22日 星期五

勝間史朗談阿發夠（１）

沒有留言:

張貼留言

2016年4月22日星期五