2012年11月12日 星期一

從統計成績來看吳清源九段的偉大





奕棋的網友tadc長官那邊知道了「圍棋的統計分析」這個有趣的網站(連結如上)。這個站其中除了有這位日本站長獨自評價的世界棋士排行榜、日本棋士排行榜以外,也從統計的角度做了很多獨特有趣的分析,每每讓我看的津津有味。這個站還有很多其他好玩的專題,例如「今後井山裕太拿到世界冠軍的可能性」,也寫得非常冷靜客觀,不愧是專門搞統計的人。但其他的有趣資料,就留待以後慢慢介紹囉。今天想先來談的是裡面關於吳清源大師的部分。

他的日本棋士排行榜原本是從1965年一路排下來的(光這點就很厲害),所以我們可以看到1965年以來日本最強棋士的交替過程。最近他又加碼分析了1964年之前的棋譜資料,做出了1964年以前的日本棋士的排名評價。在這份排行榜中,可以從另外一種角度看到吳清源大師的優異成績,如果再根據該站做的「史上最強棋士分析」之進一步的內容分析,就可以知道吳大國手在統計資料上也是非常地超俗拔群。這麼精彩的分析,身為瘋狂吳大國手迷的我,怎麼可以不介紹?所以今天想要先簡單介紹一下裡面的內容。


首先不囉嗦,請大家直接看這個排名的簡單整理結果(站方有提供個年度的詳細資料,有興趣的朋友請直接參照1964年以前日本棋士排名):

年/月
排名第一棋士
排名第二棋士
一、二名排名差距分數
第一名對第二名之期待勝率
吳清源年齡
1925/1
本因坊秀哉
鈴木為次郎
0.216
55.9%
10.7
1926/1
篠原正美
本因坊秀哉
0.228
56.2%
11.7
1927/1
岩本薰
村島誼紀
0.059
51.6%
12.7
1928/1
鈴木為次郎
本因坊秀哉
0.037
51.0%
13.7
1929/1
鈴木為次郎
久保松勝喜代
0.098
52.7%
14.7
1930/1
鈴木為次郎
久保松勝喜代
0.023
50.6%
15.7
1931/1
吳清源
久保松勝喜代
0.033
50.9%
16.7
1932/1
吳清源
加藤信
0.442
61.9%
17.7
1933/1
吳清源
鈴木為次郎
0.586
65.6%
18.7
1934/1
吳清源
長谷川章
0.519
63.9%
19.7
1935/1
吳清源
岩本薰
0.410
61.1%
20.7
1936/1
吳清源
木谷實
0.418
61.3%
21.7
1937/1
吳清源
木谷實
0.469
62.6%
22.7
1938/1
吳清源
藤澤朋齋
0.500
63.4%
23.7
1939/1
吳清源
藤澤朋齋
0.291
57.9%
24.7
1940/1
吳清源
久保松勝喜代
0.253
56.9%
25.7
1941/1
吳清源
藤澤朋齋
0.207
55.7%
26.7
1942/1
吳清源
藤澤朋齋
0.285
57.8%
27.7
1943/1
吳清源
藤澤朋齋
0.269
57.3%
28.7
1944/1
吳清源
久保松勝喜代
0.277
57.6%
29.7
1945/1
吳清源
橋本宇太郎
0.196
55.4%
30.7
1946/1
吳清源
橋本宇太郎
0.193
55.3%
31.7
1947/1
吳清源
藤澤朋齋
0.208
55.7%
32.7
1948/1
吳清源
藤澤朋齋
0.127
53.5%
33.7
1949/1
吳清源
藤澤朋齋
0.159
54.4%
34.7
1950/1
吳清源
藤澤朋齋
0.466
62.5%
35.7
1950/7
吳清源
橋本宇太郎
0.623
66.5%
36.2
1951/1
吳清源
橋本宇太郎
0.704
68.4%
36.7
1951/7
吳清源
橋本宇太郎
0.797
70.6%
37.2
1952/1
吳清源
橋本宇太郎
0.883
72.5%
37.7
1952/7
吳清源
橋本宇太郎
0.920
73.3%
38.2
1953/1
吳清源
坂田榮男
1.064
76.3%
38.7
1953/7
吳清源
坂田榮男
1.049
76.0%
39.2
1954/1
吳清源
坂田榮男
0.988
74.7%
39.7
1954/7
吳清源
坂田榮男
1.223
79.3%
40.2
1955/1
吳清源
橋本宇太郎
0.944
73.8%
40.7
1955/7
吳清源
坂田榮男
0.952
74.0%
41.2
1956/1
吳清源
坂田榮男
0.792
70.5%
41.7
1956/7
吳清源
坂田榮男
0.762
69.8%
42.2
1957/1
吳清源
坂田榮男
0.743
69.4%
42.7
1957/1
吳清源
坂田榮男
0.900
72.9%
43.2
1958/1
吳清源
坂田榮男
0.702
68.4%
43.7
1958/4
吳清源
坂田榮男
0.543
64.5%
43.9
1958/7
吳清源
坂田榮男
0.709
68.6%
44.2
1958/10
吳清源
坂田榮男
0.622
66.4%
44.4
1959/1
吳清源
坂田榮男
0.549
64.6%
44.7
1959/4
吳清源
坂田榮男
0.339
59.2%
44.9
1959/7
吳清源
坂田榮男
0.246
56.7%
45.2
1959/10
吳清源
坂田榮男
0.139
53.8%
45.4
1960/1
吳清源
坂田榮男
0.131
53.6%
45.7
1960/4
吳清源
橋本昌二
0.089
52.4%
45.9
1960/7
吳清源
坂田榮男
0.250
56.8%
46.2
1960/10
吳清源
坂田榮男
0.169
54.6%
46.4
1961/1
吳清源
坂田榮男
0.068
51.9%
46.7
1961/4
吳清源
坂田榮男
0.022
50.6%
46.9
1961/7
坂田榮男
吳清源
0.116
53.2%
47.2
1961/10
坂田榮男
吳清源
0.084
52.4%
47.4
1962/1
吳清源
坂田榮男
0.039
51.1%
47.7
1962/4
坂田榮男
吳清源
0.066
51.8%
47.9
1962/7
坂田榮男
吳清源
0.078
52.1%
48.2
1962/10
吳清源
坂田榮男
0.107
52.9%
48.4
1963/1
吳清源
坂田榮男
0.182
55.0%
48.7
1963/4
坂田榮男
吳清源
0.039
51.1%
48.9
1963/7
坂田榮男
吳清源
0.070
51.9%
49.2
1963/10
坂田榮男
吳清源
0.169
54.6%
49.4
1964/1
坂田榮男
吳清源
0.143
53.9%
49.7
1964/4
坂田榮男
吳清源
0.160
54.4%
49.9
1964/7
坂田榮男
吳清源
0.313
58.5%
50.2
1964/10
坂田榮男
吳清源
0.380
60.3%
50.4

也許大家看完這個表後除了覺得「哇,怎麼幾乎都是吳清源第一嘛~」以外,可能還有很多疑問───這個排名是怎麼做出來的?公不公正啊...?以下是日本站長的解釋說明:


  •    1964年以前的對局資料數很明顯較之後要少,所以這個結果的信賴度可能會比眼睛看到的要低。而且因為對局局數較少,也不得不將授子棋、不貼目、或貼目數較低等對局條件不平等的對局資料一起納入計算。

  •   特別是昭和初期(1925年代左右)的對局沒有固定的時限,又有很多上手主導打掛等相對於現代不公平的特權,但站長還是試著將這些因素考量進去加以評分。
  •    在原網站中RD值(排名偏差值)越小的結果,在總排名中的可信度就越高。(RD值受對局數)
  •  排名的計算方法是基於最大似然估計法(Max Likelihood Estimation)所建立起來的模型。(從站長其他的排名資料與驗證來看,這個方法的準確性還蠻不錯的)
  •  根據不同的受子數與貼目數,會對於期待勝率加以補正。其中貼5.5目的對局視為對等條件而不加補正(現代是貼6.5目。事實上從過去的統計資料來看,貼5.5目還是黑棋稍好)。此外貼五目下和棋白勝的條件,也看成跟貼5.5目的條件一樣,所以和棋白勝也看成是一般的白棋獲勝。(就日本的規則來說,和棋白勝的結果比一般白棋獲勝的結果要差,所以詳細討論的話,這可能會有點問題)。
  •  在不貼目的同等棋士對局中,持黑的勝率約為七成弱,所以把0.75當作基準值。這是因為在這個排名系統中,先著勝率69.5%就相當於0.75(換句話說,在這個排名系統中,差0.75就相當差一先,請大家稍微記一下這個數字)。下表則是所有授子或貼目差距的補正計算表:

條件
排名補正值
讓三子
0.75 x 3
讓二子
0.75 x 2
不貼目持黑
0.75
貼目2~4.5之間
0.75 x (5.5-貼目數)/6.5

  •    下表是該站站長用來計算排名的資料局數。其中所謂的「差距賽」是指不貼目、貼目四目以下的小貼目棋、或是受子棋。而「分先賽」就是指貼目4.5目以上的棋。只不過貼4.5目明顯是黑棋有利,所以此處不稱為對等條件,而是稱為分先。(從這份表也可以看出為何這位站長要從1925年開始排名───因為在日本棋院1924年成立後,1925年起的對局數才爆發性成長。在這之前每年的對局數都只有個位數@@。另外也可以看到平衡棋與不貼目棋的世代交替以及因為戰爭而出現的對局數量變化等有趣內容)

合計
差距賽
分先賽
合計
差距賽
分先賽
1901
5
5
0
1933
409
409
0
1902
5
5
0
1934
464
459
5
1903
0
0
0
1935
471
465
6
1904
1
1
0
1936
401
398
3
1905
0
0
0
1937
372
370
2
1906
2
2
0
1938
357
357
0
1907
3
3
0
1939
440
427
13
1908
12
12
0
1940
466
460
6
1909
24
24
0
1941
560
536
24
1910
15
15
0
1942
555
550
5
1911
8
8
0
1943
379
373
6
1912
13
13
0
1944
174
168
6
1913
24
24
0
1945
11
6
5
1914
20
20
0
1946
293
291
2
1915
18
18
0
1947
164
159
5
1916
16
16
0
1948
406
405
1
1917
12
12
0
1949
409
397
12
1918
5
5
0
1950
777
687
90
1919
7
7
0
1951
580
532
48
1920
26
26
0
1952
520
457
63
1921
18
18
0
1953
573
484
89
1922
23
23
0
1954
561
472
89
1923
30
30
0
1955
716
510
206
1924
122
122
0
1956
680
515
165
1925
585
585
0
1957
1024
582
442
1926
220
220
0
1958
1198
636
562
1927
255
255
0
1959
1336
707
629
1928
314
314
0
1960
1317
698
619
1929
327
327
0
1961
1462
599
863
1930
355
355
0
1962
1547
647
900
1931
380
380
0
1963
1806
707
1099
1932
391
391
0
1964
1730
680
1050


  •   在這段時期中的棋賽,常常會有一局棋下好幾個月的情形出現。所以這個排名中的對局日是統一成對局開始日計算。
  •  棋士的名字可能會改過好幾次,排行表統一使用固定的名字。例如:藤澤朋齋九段在戰前是叫庫之助,在此表中則仍是使用朋齋。
  • 根據這個排行表中的分數,可以推算兩位棋士之間的期待對戰勝率。其公式為: 棋士A對棋士B的期待勝率=1/(1+3^(B排名分數-A排名分數))

該站站長的整理感想:
  •  在此一時期中,吳清源幾乎都是第一名,特別是1950年代的顛峰期到被坂田榮男九段追上為止,計算的結果其差距幾乎都跟第二名相差一先(0.75)以上。
  • 根據此表的結果來看,如果把第一名和第二名以下的差距看成是他的傑出度的話,吳清源的傑出度是昭和時期以後的的最高值,傑出度第二高的則是1965年左右的坂田九段。再之後的傑出度因為頂尖棋士層越來越厚,在日本國內就已經看不到這麼大的傑出度了。
  • 本因坊秀哉名人在大正時期到昭和初期之間幾乎都是下授子棋,完全沒有拿過黑棋。而且因為他的對局數很少,所以很難做出精緻的棋力評價。但就有限的資料來看,已經有好幾位棋士已經追到跟他沒有差距的程度。
  • 1930年代吳清源九段登場以後,幾乎維持第一名寶座不動。進入1960年代之後雖然被坂田九段超越,但是吳清源九段在進入1960年附近的對局數比較少(可能是車禍的影響),所以很難明確推算出坂田九段是何時超越他的。

我的感想:

  • 從這個排行中可以看出,要靠統計明確比較出棋力高低的差異,統計數量一定要夠多(雖然該站站長已經一再提醒這件事了)。在1925年以前一年的對局數很難超過一百局以上時,很容易看到奇怪的趨勢出現。例如應該是秀哉之後第二高手的瀨越憲作或雁金準一幾乎連十名都排不進去。
  • 另外一個有趣的現象是木谷實九段打到第二名的時期非常之短,反而是藤澤朋齋比想像中還要早出頭。
  •  吳清源在初期段位雖然低,但每年的全年成績都是像30勝7敗(1931年)、36勝4敗(1932年)、44勝4敗(1933年)...這種嚇死人的成績,即是放到現在來看也是毫不遜色的優異成績。這個維持長達三十年的霸主地位得來真是一點也不僥倖。
  •    吳清源和第二名最大差距的1954年(坂田榮男九段),數值達到1.223之多,幾乎是相差二子(事實上,他在此時期也維持過去二子差一段的傳統,在1952年和中村勇太郎七段下二子棋,結果只輸一目)。過去江戶時代,只要「天下讓先」就具備了成為名人的資格,如果是「天下二子」的話,簡直就是名人中的名人了。難怪此一時期會有人提議推舉吳九段成為名人,真是實至名歸。

至於吳大國手另外一個偉大的事蹟,就是他的十局賽了。且讓我們還看看該站站長對此有何分析,更可以知道這樣的成績有多難能可貴。

該站站長關於吳清源十局賽的統計感想

  •  將當時所有的對手棋士通通降級、而且完全沒有相剋的問題、長時期維持最強的棋力,就是吳清源九段的棋力價值所在。
  •  從十局賽的總成績來看,將對手降級之後有成績變差的傾向,所以另外做一個總成績與降級之後對局除外的總成績之比較表。另外,為了方便計算,如果出現和棋,則做0.5勝0.5敗計算。

吳清源九段十局賽總成績

對局數
勝率
換算平衡棋推定勝率
吳持黑
33
28.0
5
84.8%
72%
吳持白
56
30.5
25.5
54.5%
72%
合計
89
58.5
30.5
65.7%


吳清源九段十局賽去除降級後對局成績

對局數
勝率
換算平衡棋推定勝率
吳持黑
28
25.0
3.0
89.3%
79%
吳持白
48
30.5
19.5
59.4%
78%
合計
76
58.5
22.5
70.4%


  • 根據降級之後的對局除外以後的數字來看,吳清源九段和對手互先下十局的話,可以預期獲得7.4勝2.6敗的成績。光有這樣的預期勝率,就幾乎不可能被對手降級;但卻也不能保證一定可以將對手降級。
  • 由於被吳清源降級的對手,都是後來進入新聞棋賽時代獲得過許多個頭銜的強豪。光從這樣的對手陣容來看,能留下這種水準的成績,也能認為他具有當代頂尖棋士的棋力。
  • 如果利用邏輯分布給予適當的補正值(參照該站的其他討論文字),再將他的成績換算成平衡棋來看他的勝率的話,沒有很明顯不擅長拿黑棋或白棋的傾向。平均來看,在分先的條件下會具有78%的勝率,因此從分先開始下的話一定能夠將對手降級。
  • 此外,吳清源拿黑棋幾乎沒輸過,因此這比他的白棋優異成績還要令人注目。尤其在全盛時期間完全不可能會有被對手降級的危險,所以他總是利用持黑必勝的優勢掌握住整體比賽的有利性。
  • 就結果來看,以棋力將對手壓倒的吳清源九段幾乎不用擔心在十局賽中被對手降級,但要在十局中比對手多贏四局而將對手降級也不是容易的事,所以其內容多少點無理的感覺。但也可以說是升降十局賽本身是個負擔沉重的嚴酷企劃造成的。
  • 以進行十局賽的全盛期(1933~1956)的總成績來看,不貼目時持黑的勝率約為83%左右,而持白的勝率約為59%左右,如果換算成平衡棋(有貼目)的話,預期會有70~75%的勝率。就對戰棋士幾乎都是當時第一流棋士來看,這也是個相當傑出的數字。