顯示具有 圍棋- 棋士- 王銘琬 標籤的文章。 顯示所有文章
顯示具有 圍棋- 棋士- 王銘琬 標籤的文章。 顯示所有文章

2025年10月3日 星期五

以感性去討教(12) 王銘琬後篇

對王銘琬 後篇~左上兩者感覺之差異


[前言]


受到AI的影響,職業棋士的棋中,遇到對手掛角時,有減少使用夾的傾向。不過自認是「昭和的棋士」

之王銘琬九段可就不同了。因此後篇就從主題圖的白1二間高夾開始談起。


===

2025年10月2日 星期四

以感性去討教(11) 王銘琬前篇

 (06)對王銘琬 前篇~締角與碰之間的「手談」


[前言]


這次的特別來賓對局者是王銘琬九段。其獨特的感性被稱為「銘琬世界」,可說是最適合本專欄的棋士

之一。不過他和大西七段之間,是除了正式公開的棋賽之外完全沒有任何交集的關係,這次是由本誌編

輯部特別推薦而出場的。

2018年10月20日 星期六

王銘琬九段的後阿發夠報告(37)完


[感覺得要修正]

下完前譜之局後,如前所述,我就用里拉零來分析此局,竟然發現2圖的空心提時,明顯是白棋不好
的形勢了。

如4圖所示,1圖的白28應該要普通地(?)在1小飛才是最佳著手,白A打之後,怎樣都不可能
是白好了,是AI給出的結論。

4圖 里拉的結論


阿發夠在李世石版本時以所謂的「阿發夠肩衝」讓大家看到了AI強調「其理解了人類看不到的中央
重要性」,然而到了阿發夠零時卻又讓大家看到了「立即進三三」,這種比人類還追求實利的判斷。

2018年10月19日 星期五

王銘琬九段的後阿發夠報告(36)


第十四回(最終回) 人類來下才叫圍棋

[留下推廣圍棋的材料]

「後阿發夠報告」到此是最後一篇了。

阿發夠雖然退休了,但圍棋AI的開發仍然在加速進行著。目前有很多想要跳脫阿發夠框架的嘗試正
在進行著,也許有一天就會出現超越阿發夠棋力的軟體。不過阿發夠所達成的先驅式的成果,造成圍
棋世界產生巨大變化,就這個意義來看,未來不管哪個圍棋AI都難與比肩而立。

阿發夠帶給圍棋界的影響實在太大,看起來到現在為止其影響都尚未完全顯現出來。將來如果要回顧
圍棋史之時,恐怕真的得分前阿發夠時代與後阿發夠時代才行呢。

2018年9月12日 星期三

王銘琬九段的後阿發夠報告(35)


[以「價值大小」來思考的缺點]

然而,使用「價值大小」的觀念來考慮的方法有兩個缺點。

第一是實行時機的問題。現在自己正在思考,指的就是次一手尚未決定好的意思。至於再下一手對手
會下在哪裡,也是不知道的。即便如此,現實上還是只能先假設出對手的著手思考下去,當然這個假
設是充滿了許多不正確的要素。換句話說判斷價值大小這件事,本身就不得不變成了誤差很大的推
測。

另外一個則是意義的問題。為了測出價值大小,明明自己也還沒下,卻得先假設對手怎麼下。圍棋是
看到對手怎麼下後來決定自己著手的一種「啊,你這麼說,我就這麼回答」的遊戲。當然對手的著手
也是根據自己現在下的這著棋來決定的。既然自己還沒亮出自己想下哪裡,卻來假定對手的著手,怎
麼看都有點異樣且脫離現實的樣子。

2018年9月10日 星期一

王銘琬九段的後阿發夠報告(34)


第十三回 該怎麼向AI學習

現在是進入了電視對局中常常會聽到「目前這手棋是受到AI影響的下法」解說的時代。換句話
說,AI的下法也常常會在職業棋士的棋譜中看到了。

因為恐怕目前不會有人懷疑AI比人強的關係,所以人類也開始學習AI的棋。AI的下法到底為什
麼好可能未必讓人想得通,總之先下下看,也許就會在過程中搞懂了。現在我們可能就處在這個階段
上。

2018年8月21日 星期二

王銘琬九段的後阿發夠報告(33)


[不懂征子的「零學習方式」]

我持續在追蹤的電腦圍棋主題,就是圍棋中的「局部與全局」。讓電腦圍棋能夠有飛躍性進步的「蒙
地卡羅法」就是直接拿全局來模擬,而具備了形勢判斷的能力;但相反地,局部上的攻殺或死活它就
無法正確地計算出來。

比如說,像2圖這樣的棋形,人類的話,就會把這個右上角用「局部」的方式來思考,而判斷出黑1
立下就可以讓黑棋無條件獲勝;但因為蒙地卡羅法只會用全局的方式來模擬,所以除非它判斷右上角
非得馬上下不可,否則根本就得不出結論(下到別處去)。如果無法清楚把握住角上的死活狀況,別
說是計算實地目數,就連週圍棋子的強弱程度都無法判斷清楚。

2圖 局部的攻殺

我覺得這是個極端重大的缺陷,但該如何去教導電腦「局部」的計算,卻是個讓我非常困擾的事情。
至於深度學習也是在作全局的模擬,雖說「不擅長局部」的症狀比較輕一些,但還是沒有完全解決掉
這個問題。話又說回來,雖然它對於局部的理解還有問題,不過我覺得它還是能靠著全體模擬的強大
能力來蓋掉這個問題。

2018年8月20日 星期一

王銘琬九段的後阿發夠報告(32)


第十二回 人類的棋與AI的棋之差異

[給人類帶來很大影響的阿發夠]

以中國為首的圍棋AI開發是越來越興盛,讓「阿發夠帶來的東西」中有部分的輪廓是越來越清晰。
而持續將近一年的這個連載,也再過三篇就會結束。

現在不管是談話或報導,只要是說到AI,常常都是從「阿發夠」開始切入。因為阿發夠讓全世界注
意到AI的能力,大家也都以此為前提來考慮未來的景象。阿發夠不僅僅是展現了一種技術,而且完
成了一種進入新世界象徵的任務。

就算阿發夠沒有出現,隨著AI的研究開發進步,時代也還是會改變的。不過,就是因為阿發夠鮮明
精采的表現,才讓AI受到眾人的關心,才讓世界有了更巨大的變動,使得對於深度學習的投資與開
發更加加速起來。

而且阿發夠不僅是影響了人類社會的意識,而且對於AI相關的軟體與硬體兩方面都產生了很大的影
響,並且帶給未來的人類社會更大的影響。這是歷史上首次借用了圍棋這個「容器」所以達成的事
情,而且也必須是具有普遍內容的圍棋才可能達成這樣的效果,這是身為一介圍棋棋迷,覺得無比自
豪之處。

不過,這也不全都是值得慶賀之事。成為阿發夠專案集大成的「阿發夠零」,是個能力非常強大的自
我學習系統,而且甚至可以套用到圍棋以外的事物上。好比說和圍棋屬於不同性質的「不完全情報遊
戲」之撲克牌,套用了阿發夠零的AI學習系統,也還是可打到超越人類的程度。從這個角度來看,
不管哪個領域,都會出現AI遠比人類厲害的狀況吧?接下來可以看程AI會代替人類為了變厲害而
努力,但另一方面也可以說,原本人類為了變厲害所建立起來的東西,也都會受到AI嚴峻的挑戰。

[很難掌握阿發夠的全貌]

要總結阿發夠的棋力當然是非常非常難的事。在討論這麼大的題目時,也會因為所處的立場不同,而
看到不一樣的東西。

1圖是阿發夠對李世石五局賽的第二局,黑1肩衝這手棋也是阿發夠開發團隊負責人德比斯.哈薩比
斯先生很喜歡的一手棋。因為在這個局面下預料到阿發夠會下這手棋的職業棋士一位也沒有,黑1就
被定位成「能提出超越人類看法」的指標,而且成為阿發夠代表性的一手棋。

1圖 阿發夠的代表性著手


但是我並不覺得這手黑1有那麼偉大。因為使用蒙地卡羅法的軟體本來就很喜歡下「肩衝」的棋。因
此,就算換成了同一時期的店長來下,可能也會下出這一手棋。就這個意義來說,反而是五局賽第一
局中贏了李世石的AI選擇了此著,更讓我驚訝。

但對於黑1這手棋,人類當時是覺得很感激,因為覺得馬上下A或B就可以賺到便宜。這是因為當時
阿發夠是學習人類的棋譜,所以可以預測白棋的應手主要也會是A或B才對。而右上角原本黑棋只要
做了黑C、白D交換就能圍到實地,所以當黑1肩衝時,白棋只要應一手,黑棋就會準備繼續在C位
利用。

然而,阿發夠零卻沒有學習人類的棋譜,所以黑1之後,它會考慮白A、或B應以外的變化;或者也
會考慮白棋應了之後,黑C取利時,白D不理的狀況。所以,雖然以下是我的推測,但我想這個局面
改由阿發夠零來下的話,改下在黑1以外的可能性非常之高,當然它也會獲勝吧。

(譯註:果然店長七選擇的落點就不是肩衝,而是參考圖的黑1罩。黑A扳是它的第二志願)

參考圖 店長七的選擇

換句話說,只要棋力更強,就算不是下在黑1也能獲勝。而且,與使用其他的手段獲勝的棋譜相比,
反而會讓人重新湧現黑1這手棋真的是好棋的疑問。看起來,這個局面的選擇會造成怎樣的影響,人
類恐怕還得持續尋找下去。當然,黑1在當時,的確帶給圍棋界一個新見解,絕對是永留棋史的一
著。不過這一著因為是其他軟體也可能會下的一手棋,所以「最後能夠獲勝」這件事反而更加重要。

對於每一著的解釋,每個人都可能不一樣,而阿發夠李世石的版本與阿發夠零的版本也可能會做出完
全不一樣的選擇,所以每一個局面也都很難做出「這是阿發夠老師說只此一手」的結論。不過,既然
不管哪一種方法,都無法利用阿發夠整理出全貌,我反而想要來介紹一下至今為止我最在意的一個地
方....。

===



相關系列文章:

2018年7月26日 星期四

王銘琬九段的後阿發夠報告(31)


[中國出現了新的圍棋AI加入熱潮]

就在這一個月中,陸續有高水準的中國製圍棋AI發表。4月下旬,在吳清源老師出生的故鄉中國福
建省福州市舉辦了「吳清源杯」的比賽。這個比賽可是當地政府全力支持的大活動。內容分為世界女
子職業棋士錦標賽、全國業餘圍棋大賽。在圍棋AI項目中,除了舉辦了世界圍棋AI錦標賽外,還
安排了新的圍棋AI「星陣」與朴廷桓、柯潔為首的頂尖職業棋士的三十局大賽。

2018年7月23日 星期一

王銘琬九段的後阿發夠報告(29)


第十一回 回到戰場的Facebook

[加油田淵君!]

五月上旬,大名鼎鼎的臉書竟然將使用阿發夠零論文所做出來的圍棋AI的原始程式碼公開出來了。
這正式宣告兩年前在UEC電腦圍棋大賽決賽中和店長爭奪冠軍的黑森林(Dark 
Forest)程式的作者田淵棟先生回來了。

田淵棟先生來自於中國大陸,自然是姓田。不過因為他的名字剛好是淵棟的關係,對於日本人來說這
個姓氏一點都不奇怪(譯註:因為日本有田淵這個姓氏,就日本人來說,這個名字也可以看成姓田
淵、名為棟的人),所以在我心裡則是故意把他的名字念成了田淵(Tabuchi)君,因為這樣
很好玩。後來黑森林也退隱江湖,還我以為從此和田先生無緣再會了,沒想他卻在完全意料之外的地
方給大家驚奇一擊。

2018年6月23日 星期六

王銘琬九段的後阿發夠報告(28)



[Zen的「難移本性」]

回歸成店長(Zen)這件事,讓我想起一些它「本性難移」的有趣事情。

2009年,當店長首次以對局引擎的方式成為商品時,曾經和我下過一局紀念性的對局。當時的局
差,竟然是七子(!)。

這倒不是我想照一般倚老賣老的宿老說出當年自己曾經讓過現在當上名人的人多少子的炫耀。相反的
是,我想告訴大家當年這樣的局差有多辛苦。

2018年6月22日 星期五

王銘琬九段的後阿發夠報告(27)


阿發夠Zero使用了股溝公司自豪、為了深度學習專用的處理器TPU五千顆,花了四十天才到達
了那樣驚人的棋力。據說這四十天所花掉的電費可是高達數十億日圓呢。

至於絕藝沒有TPU可用,所以據說可能使用了一般市售的GPU十萬顆。其價值據說粗估起來也達
到了一百億日圓的程度。這些數字都是在說明了毫不猶豫、直衝目標時就需要花上這麼多時間與金
錢。

換句話說,僅僅花了兩個月就能使用阿發夠Zero的方式完成升級,就是需要難以想像的資金與技
術力,可以說是僅有像騰訊這樣的巨大企業才辦得到的玩意了。

2018年6月21日 星期四

王銘琬九段的後阿發夠報告(26)


第十回 再會了,DeepZenGo

[令人遺憾的退休]

可說是日本最強的圍棋AI---DeepZenGo(以下簡稱DZG)已於今年四月退休了。這則新聞不
僅是在日本,就連海外也都被盛大報導。DZG的前身Zen是從市售對局軟體引擎開始開發的,現
在最新的版本也可說是市售軟體中棋力最強的,所以長期在各國大受歡迎。

在中國,它也因為加入了可以和人類頂尖高手交手的世界圍棋賽而造成話題,所以知名度也非常高。
在圍棋中通常只要有下過棋自然就會有變成好友的感覺,所以對於世界各國的棋迷而言,一定會對於
有和世界頂尖高手作戰經驗的DZG要退休感到惋惜。

2018年5月8日 星期二

王銘琬九段的後阿發夠報告(25)


[「變化」就是對局者感受到的東西]

當然,圍棋中的「變化」倒底是甚麼東西,其實是非常難回答的問題,而且也可能因為人或是時代而
有所不同。當圍棋被電腦「完全分析」之日到來時,「沒有任何變化(都在預料之中)」的看法也可
能是成立的。不過呢,我們之所以喜歡圍棋,就是覺得圍棋是最充滿變化的遊戲對吧?反過來看,也
可以說身為對局者的人類之感覺,決定了圍棋的變化數。

就這種意義來說,圍棋的變化恐怕會比十的360次方還要多很多吧。就算是同樣的手順造成了同樣
的局面,只要是「對局者」不一樣,在那人的眼中看起來就像是「不同的局面」(譯註:例如舊名人
賽第四局林海峰對藤澤朋齋之局和八年前的吳清源對藤澤朋齋之局一樣)。對那人而言,這就是和以
往不同的新局面。假設就算是同一個人去下同一局棋,也不可能會和之前下過的一模一樣。換句話
說,圍棋的變化是十的360次方之外再加上所有對局過的數目。我覺得這簡直就像是俗語說的「一
碁(期)一會」(一局棋就是一場全新的相遇)啊。

2018年5月7日 星期一

王銘琬九段的後阿發夠報告(24)


[不同的手順就是「變化」]

我之所以要強調「意義不同」,也是為了回答如果不是出現在劫爭的場合下,是不是就會變成了相同
的局面就等於相同的變化。

5圖是常見的佈局之一。即便如此,要形成這個圖,也包含著對局者的疑慮與反覆累積的思考過程。
好比說,白2就有下在對角斜星的選擇;而黑3也是在考慮過後續要不要佈起迷你中國流等等許許多
多的構想中才決定這樣下的。白4也是在感受到黑棋的意圖下,挑出當時最想下的一著;再之後的黑
5也是受到白4落子位置的影響才對。

2018年5月6日 星期日

王銘琬九段的後阿發夠報告(23)


第九回 圍棋對人類而言的趣味性與價值

「對人類而言」這種用法有點沉重,是我很不想要使用的詞句之一。不過,既然AI的能力已經到了
能與人類比肩而行的程度,甚至已經走在人類的前面,未來顯然所有的事物也都會和AI有更深入了
關聯。

透過圍棋而接觸到AI的經驗中,讓我最常想到的事情是「AI和人類並不是相同的」這件理所當然
之事。即便如此,今後所有的事物中,都會有這種人類和AI的工作混在一起的狀況。雖然這會讓人
覺得有點痛苦,但將來不管說到甚麼,無法避免說到「對人類而言」的場合應該是會越來越多才對。

2018年4月11日 星期三

王銘琬九段的後阿發夠報告(22)



[嘗試說明深度學習]

目前的圍棋AI只會顯示出「下在哪裡」,卻不會說明「為何要這樣下」。這是因為深度學習技術無法
說明獲得答案的過程。不過,如果用熱圖(Heat Map)的方式來強調搜尋答案的過程的話,以某種程度
而言就連人類的感覺也能夠理解這種過程。

我所參加的GoTrend團隊就是用熱圖進行實驗。在熱圖的變化過程中,就能看出顯示出選擇出落
點的過程。熱圖中黑色與白色的部分,就是代表AI在評價某處落點時關注棋盤上的位置。白色的部分
,就是AI贊成落點的位置,而黑色的點則是AI反對的落點。

2018年4月10日 星期二

王銘琬九段的後阿發夠報告(21)



[完全無法想像的急所]

接下來阿發夠教學工具分別推薦了9圖實戰的白2與黑3要改下在A位與B位。對於這一點來說,或
許真的應該如此。

9圖 教學工具(Master版)的建議

2018年4月9日 星期一

王銘琬九段的後阿發夠報告(20)


[用阿發夠教學工具來看阿發夠的棋就非常有趣]

然而,如果是用這個工具來看阿發夠自己的對局譜
,那麼就可以看到相當後面的內容。好比說,用它來擺阿發夠對李世石之戰的第一局,其分析的內
容就非常有趣。

3圖就是這一局的佈局狀態,至白6為止是常有的佈局,所以次一手就顯示出了十一種選擇,這十
一個選擇中,就包含了李世石下的黑7。這手棋是李世石用來測試阿發夠之用,可說是第一局的註
冊商標之一。

2018年4月8日 星期日

王銘琬九段的後阿發夠報告(19)


第八回 加入教學行列的AI

阿發夠雖然是以帶給大家衝擊的方式下退休,但它真正代來的影響也許要在未來才會真正顯現。因為
圍棋AI接下來將不可避免地得往「教學」方向前進。就像我們過往介紹過的一樣,圍棋AI在指示
「最接近勝利的手法」上具有極高的能力。而且不管是變化圖或是評價值等內容,理論上只要人類想
看,AI都會讓人類看到高興為止。畢竟它能簡單地整理出我們想要的答案。

現在也因為阿發夠的關係,不管是誰都有可能它論文中提示的方法做出超越職業棋士棋力的圍棋
AI,而且世界上不管甚麼地方也都有可能發展圍棋AI,這對職業棋士來說也是很大的威脅吧。