2017年11月14日 星期二

王銘琬九段的後阿發夠報告(8)


[CGI一躍至頂尖集團]

其他值得特書一筆的,則是獲得亞軍、來自台灣的CGI。它在第一天的預賽中連續擊敗了絕藝、DZG兩強,竟然以全勝的姿態獲得預賽第一名。雖說是預賽,AI也沒有必要保留實力,所以它有這樣的成績,真的是讓大家嚇了一大跳。就算是和DZG進行冠軍決戰時,也一時站在明顯的優勢地位,遠遠超過預期以外的大活躍。

CGI的厲害之處,就是它和絕藝或DZG不一樣,迄今為止幾乎完全沒有借用企業的力量。CGI是台灣交通大學的吳毅成教授研究室所開發出來的AI。完全就是教授與幾位研究生腳踏實地做出來的。由於它非常早開始導入深度學習的程式,可說是新世代圍棋AI中最值得期待的軟體之一,不過在四月的UEC杯中卻沒有打入前四強。

不過它在累積了許多的細微修改,就在這次的世界大賽中令全世界驚豔。在中國即使是現在仍然還有很多想打著開發圍棋AI名號的企業,這些企業大多想強力拉攏CGI的團隊,但吳教授的目的是在研究,所以對這些邀約是一律回絕。

CGI雖然是歷經了很多細微的改良,但這些改良大致上可以分為以下三種:

1.成功達成平行運算的目標。
2.全局盤算棋力的增長。
3.深度學習的評價基準複數化。

吳教授雖然說:「因為我們修改了很多地方,所以到底哪一項改良才是真正促進棋力進步的因素已經變得不明確了」,但他最後總結說:「大概總體來說這些改良都有些好影響吧?」。

上述的改良之中,其實1和2與深度學習沒有關係,可說是在阿發夠出現前強化軟體棋力的標準程序,但以往CGI是以深度學習為中心進行開發,所以直到最近為止都沒有時間這些項目的調整。

不過,第三項的深度學習評價基準複數化可就是吳教授的獨創了。至今為止的形勢判斷,都是只針對七目半一種貼目來考慮結果。而CGI則是再加上了好比說五目半、三目半、一目半等等許多種不同貼目的評價。而使用這樣複數評價的結果,就是「能夠更加仔細精確掌握住局面」。

如果要更加簡明地看出這種方法的效用,可以利用1圖Master六十盤其中最後一盤對古力的局面來觀察。

1圖 Master vs古力(黑)

局面優勢的Master下出▲之著,然後數手之後被黑1點入而吃虧了。就Master而言,不管是下在▲或正確下在A位,反正在貼七目半下都是贏棋,所以其實▲與A位的評價都是一樣的,不管下在哪兒都一樣。

不過若是加入了貼目五目半或三目半為基準的評價,▲或A位對勝負就會有影響,而讓整體的評價往下掉,這樣就有機會讓AI下到正確的官子上。

人類和AI不同之處,其中之一就是人類具有複數的評價基準,所以CGI在深度學習中也加入了複數的評價基準就是一種非常有趣的嘗試。

令人意外之處,就是DZG或CGI都具有深度學習以外的功能在比賽中發揮效用,而獲得了好結果。雖然可以想見之後的圍棋AI霸主還是要能夠巧妙應用深度學習的威力,但是比較古老的圍棋程式到了現在仍能對AI的棋力進步做出貢獻,只能說圍棋真是太深奧了。

今後CGI會和台灣的海峰棋院合作,讓台灣的職業棋士訓練中也加入AI來參考。由於絕藝、DZG、CGI各自有不同的背景與特徵,而使得圍棋AI世界呈現了三強鼎立的狀態,也讓圍棋AI世界越來越有趣了。

===



相關系列文章:

沒有留言:

張貼留言