2018年1月3日 星期三

王銘琬九段的後阿發夠報告(16)



[發表時期之謎]

還有一件事也很讓人驚訝,就是阿發夠零的論文提出時間竟然是2017年4月。

換句話說,我們認為在2017年五月「圍棋未來高峰會」時,阿發夠零早就完成應該是合情合理的
。股溝公司方面沒有在這個活動期間公開這件事,應該有非常多的理由吧?但對於完勝柯潔先生的
Master版本來說,身為圍棋迷則會想東想西、留下一些難以釋懷的心情。

原本包含我在內,有很多人都預測股溝公司會用「沒有教學的學習版本」阿發夠來對付柯潔先生,因
為這樣的話,阿發夠對柯潔之戰會更有意義。然而出戰的卻是「Master」版本,就讓整個活動
中少了很多聯想的話題。原本大家都認為這種從零開始沒有教學的學習在圍棋上是行不通的,直到阿
發夠零發表之後,才讓全世界理解到這種沒有教學的學習是可行的。

阿發夠零雖然讓圍棋AI再度受到注目,但論文中還是有很多不清楚之處,所以我覺得這個論文是為
了該公司的利益而搶先發表的。AI的開發,主要都是在大企業中進行的,所以像阿發夠這樣的AI
,是非得有強大的資本才可能開發出來的。也是這樣,開發單位就會想緊緊抓住所有的開發資料,然
後以對企業本身最有利的形式放出這些資料。

即便如此,還是不得不說DeepMind公司與股溝願意將相關資訊公開是很偉大的。因為2017年11
月,新的圍棋AI「符合預期」、很快參考了阿發夠零的論文而再度進化,將「絕藝」打到了讓二子。
甚至讓開發出新AI的中國騰訊公司發表了「拜DeepMind兩次技術公開之賜」的感謝詞。不論好壞,
「阿發夠經驗」如果能對未來發生影響,也是一種對圍棋的很大貢獻了。

[論文中的定石講座]

阿發夠零的論文中,花了兩頁做了一個分析定石的專欄。論文中說明:從如白紙一般開始學習圍棋的
阿發夠零,在自我對戰之中「找出」了定石,並且也「創造」出了新定石。

1圖是大家都很熟悉的定石型態。論文中也貼出了隨著自我對戰的時間變化此定石出現頻率的圖表。

1圖 小目碰退定石

根據定石出現頻率圖,此一定石是在自我對戰開始後20小時左右出現,然後到了40小時之時,出現
的頻率已經多到最初的五倍了,但在那之後卻開始變少。這個圖表中展示了阿發夠零的能力與其圍棋觀
的轉變,因此特別受到注目。

但對我來說,也想要知道此圖中白8下在A位的頻率或是白6下在B位的頻率。不過搞不好A位這手棋
的出現頻率比拆的更寬、或是直接脫先的頻率要低。此外,我猜白B虎的出現頻率雖然高一些,但卻會
因為一面學習自己棋譜的關係,漸漸演變成黑棋不理白B虎的情形變多起來吧。我覺得如果要簡潔做出
定石的整理結論的話,就只能做到這種程度才行。

論文中甚至也出現了可能記起來也很好的棋型。

2圖白20為止的變化,是人類對局中幾乎不會出現的型態,但從論文中附上的圖表可以看出,從開始
自我對戰學習的50小時左右開始就越下越多起來,之後到70小時為止其愛用度還是持續增加著。雖
然不清楚這種情形是不是在所有的對戰棋譜上都能看到,但可以推測出來隨著下星位的次數變多下,這
個棋型的使用次數也跟著變多起來。

2圖

這個棋型接下來應該也會在很多職業棋士的對局中看到吧。

===


相關系列文章:

沒有留言:

張貼留言