2017年11月15日 星期三

王銘琬九段的後阿發夠報告(9)


[令人期待的韓國「石之風」]

阿發夠預定在今年中再公開新的內容(截稿後,阿發夠零出現了)。如果公布的內容包含了使圍棋AI變強的技術,那麼一定會給予目前三強(絕藝、DZG、CGI)之外的軟體迎頭趕上的機會。

首先值得注意的,則是韓國的「石之風(DolBaram)」。作者林在范先生是看到了2012年店長對上武宮老師的四子局而深受感動,立志開發圍棋軟體。雖然它是起步比較晚的軟體,但也曾在2015年拿下過UEC杯的亞軍,讓大家看到了這個程式具有追上領先群的氣勢。現在它的棋力大約與領先群相差一先或二子吧。這個程式雖然是比較晚導入深度學習,但目前卻是代表韓國的軟體,而深受韓國各界支持而備受期待。

[「GoTrend」也開始在幽玄之間的對弈服務]

接下來很抱歉要說說關於自己的事,就是我參與開發的圍棋軟體「GoTrend」也重新開始開發了。但研發的方向則是略有改變。以往的圍棋AI都是以怎樣變得更強的方向來開發的,但GoTrend卻以相反的方向為目標。

換句話說,就是圍棋AI如果去學習何謂「弱小」不也是很有意義的事嗎?在這方面上GoTrend的開發主持人台灣東華大學的顏世淨教授和我的意見是一致的。

現在說到對局的場所的話,是絕對無法把圍棋對弈網站排除在外的。而在未來,這種需求應該會更加增加才對。不過初學者或級位者就算去到了這些對弈網站,常常也會出現找不到對手的情形。

這是因為除了具有同樣棋力卻沒有對局的對手很少以外,就算想邀請高手指導,往往也不願意和他們對局的關係。於是GoTrend就從九月開始在日本棋院的對弈網站「幽玄之間」上設置了一個對局機器人的帳號,開始了對局服務。

這個對局機器人的帳號叫GoTrend0xx,具有好幾種不同棋力的版本在線上等待對手邀請它們來對局。當某一個版本被邀請對局時,我們會想辦法盡量安排另一個版本的機器人上線等待另一位棋友的對局邀請。

[用深度學習法來學習「弱小」]

現在我們碰到的問題,就是圍棋AI變強過頭了。GoTrend在阿發夠出線後雖然中止開發,但當時也到業餘八段的棋力。如果要用接近分先的狀態來當初學者、級位者棋友的對手、該如何讓他們下的開心,其實是意外地不簡單。

圍棋AI現在是以勝率為基準來決定次一著,所以可以利用總是選擇勝率接近50%著手的方法來讓程式變得好下。不過,這種選擇方法,到了形勢變好之時,就會為了維持接近50%勝率的狀態,走出了故意去送子被吃的著手,而讓人類馬上覺得是對方在「放水」。

此外,如果使用舊的軟體版本或是調整細算的深度,是可以調出符合對手的棋力,但這種軟體的棋,就會讓人感覺到「電腦味」很重,看起來很不自然。

於是GoTrend就開始了將級位者的對局拿來做深度學習的研究。現在由於是剛剛開始,「學習」得還不夠,所以目前在「幽玄之間」上僅僅放了業餘八段以下的幾個版本,預定要在半年之內可以做出以三子為棋力間隔、一路分佈到二十級為止的各種版本。

網站上各位棋友的棋都是我們的學習對象,目標是很自然的下出5級或15級棋力的棋。

===



相關系列文章:

沒有留言:

張貼留言