2012年11月27日 星期二

日本棋士之各種基本統計特性


資料引自http://sports.geocities.jp/mamumamu0413/study/data.html

在「圍棋的統計分析」站中,除了將棋士的排名做了出來,也利用了整理資料時所獲得的資料做了許多有趣的統計分析。今天這一篇就想來順便介紹一下這些日本棋士的統計特性。

(忍不住在這裡感嘆一下,像這樣的排名系統/統計資料,在中國棋院與韓國棋院都已經實施好幾年了,但在日本棋院或是台灣棋院這邊卻沒有找人來做這個功能的意願,目前都只有棋迷自己在弄。難道棋力不如人,連整理資料也不如人了嗎?)

回到正題,以下就是這些資料的整理。


日本棋士人數總數、段位分布與年齡分布

  • 在 2011年12月底為止,日本棋院與關西棋院合計有443位棋士。其中日本棋院占了320人,而關西棋院則是123人。在日本棋院的320人中,東京本院 有234人,關西總本部41人,中部總本部45人。(以這樣的比例來看,關西總本部與中部總本部出現頭銜擁有者比例的真是非常高呢)
  • 這443位棋士中,男性有361人(真巧XD),女性有82人。
  • 下表是其他各年實際有活動棋士的數量變化,可以看出棋士數目的變化趨勢。

日本棋士的歷年數量變化(1965~2010)
日本棋院
關西棋院
所屬不明
合計
1965
148
19
25
192
1966
136
19
18
173
1967
174
19
33
226
1968
158
16
17
191
1969
169
16
20
205
1970
187
22
26
235
1971
190
17
25
232
1972
199
17
23
239
1973
197
19
22
238
1974
200
22
26
248
1975
201
20
19
240
1976
202
66
35
303
1977
203
63
29
295
1978
213
66
32
311
1979
215
66
32
313
1980
223
68
31
322
1981
239
77
33
349
1982
246
73
29
348
1983
252
78
32
362
1984
255
77
27
359
1985
255
85
23
363
1986
258
89
26
373
1987
264
90
22
376
1988
271
95
21
387
1989
276
96
17
389
1990
282
97
13
392
1991
283
104
14
401
1992
290
101
12
403
1993
297
106
12
415
1994
302
99
10
411
1995
308
102
9
419
1996
314
86
8
408
1997
329
102
6
437
1998
321
94
6
421
1999
321
74
3
398
2000
324
43
3
370
2001
319
39
1
359
2002
322
42
0
364
2003
320
111
0
431
2004
320
112
0
432
2005
313
113
0
426
2006
314
112
0
426
2007
306
112
0
418
2008
303
111
0
414
2009
312
117
0
429
2010
313
114
0
427
歷年總計
477
149
63
689


補充說明:
這 個表示根據歷年日本國內棋賽的棋譜所抓出來的資料做成的。而關西棋院由於有一陣子缺少對局資料的關係(顯然也有不重視資料統計的問題),所以實際上可能有 更多有活動的職業棋士。另外所屬不明的棋士中,也可能包含業餘棋士。(另外,還有像吳清源或瓊韻社等非兩大棋院的棋士)

  • 在現役棋士中,有獲得七大棋賽頭銜的只有25人。
  • 目前的段位分布是:初段43人、二段34人、三段30人、四段25人、五段34人、六段55人、七段59人、八段53人、九段110人。(顯然不是常態分佈,也不是金字塔型的段位分布)
  • 最年輕的棋士13歲,最年長91歲(杉內雅男九段),另外有一人年齡未公開。

下兩圖是實際的年齡分布圖與段位分布圖:

年齡的分布有接近常態分布的趨勢,並且以40~45歲這個區塊人數最多。

段位的分布就相當畸形。在四段以前有走金字塔分布的傾向,但五段以後每個段位的數量又很接近,九段則多到嚇死人。

日本棋士人棋力分布

由於段位分布很難代表真正的棋力差距分布,所以該站改用排名分數來換算局差(排名分數相差0.75分約差一子。或者以相對預期勝率為69.2%則差一子、91.9%差二子、98.3%差三子來計算),再重新做出與排名第一的棋士的局差差距人數分布。如下圖所示:
圖中綠色曲線就是與排名第一棋士相差一先以內(受先)的棋士人數百分比,而紅色曲線則是與排名第一棋士棋力相差在二子以內的棋士人數百分比,黃色就是相差三子以內的棋士人數百分比。下圖則是改以總人數來表示:



根據以上兩個圖,可以看出一些眉角:

  • 在1965年代左右,全體棋士的棋力分布在三子以內(符合當初日本棋院訂定段位時初段與九段差三子的差距)。
  • 隨著時代的演變,棋力分布的差距有變大的趨勢,到了現在甚至有30%左右的棋士與排名第一的棋士棋力相差三子以上(強者越強,弱者越弱?)。
  • 不過,該站的站長說,在排名分數換算棋力差距時也許有受到時間或統計資料的影響,所以拿現在的棋力分布與過去來比較可能會不恰當。
  • 上圖中,有拿掉一些無法計算排名分數的棋士(對局數太少或排名偏差太大),另外1960年代左右總棋士只有200人出頭,而現在卻有440人以上,比較基準有相當大的差異。
  • 2008 年以前關西棋院棋士的資料相當缺乏,造成有很多無法計算排名分數的棋士出現。但在2008年改善到可以評價的棋士數量大量提升後,和排名第一名棋士棋力差 一子或差二子的人數卻沒有太大的變化。雖然這個數量應該會受到各時期排名第一棋士棋力的很大影響,但排名第一棋士自己的棋力就算有上上下下的變化,卻也沒 有持續往上上升或下降的趨勢。所以這個相差一子、二子棋士人數沒有太大變化的現象是有點奇怪的地方。

以上是從排名第一棋士角度來看的相對分布狀況,如果直接以排名分數來做絕對性的棋力分布圖,則會是以下的樣子:

日本棋士整體棋力分布(以排名分數計算)

日本男女棋士棋力分布(以排名分數來計算)

從以上這兩張圖來看,又有些東西可以解釋:

  • 這個分布圖,如上所述是排除了無法計算排名分數的棋士所做出來的。排名分數的計算時間點是2011年12月。
  • 分布圖是以0.5分來切割區間。請注意相差一分,就代表了棋力高者面對棋力低者有75%的預期勝率,相差兩分的話則是有90%的預期勝率。
  • 這個分布圖長得很像常態分佈的樣子,與段位分布圖完全不同。證明了使用排名分數來代替段位才能更合理的反映出棋力的差距。
  • 男性頂尖棋士與女性頂尖棋士的差距平均也接近兩子左右。(9.25 vs 7.25)

比較:以世界總排名分數來看各國棋士的棋力分布

為 了比較出日本棋士的整體分布在世界棋壇在哪個位置,該站也做了一個世界各國的棋力分布總圖出來,這是一個非常有意義的比較圖。世界排名分數是以該站的統計 系統來計算(請注意該站的日本排名分數是只計算日本國內的棋賽,而世界排名分數則是包含世界賽在內計算,所以計算出來的排名與分數會有些差異。例如在今年 11月的排名中,河野臨在世界排名系統來看算是日本排名第三,但在只計算日本國內排名時,他卻只排到第五),計算的時間點也是2011年12月。其中考慮 到信賴度的問題,日本棋士只計算全體443位現役棋士中的392人,而韓國棋士則是全體棋士中251人中取出225人。中國現役棋士的總數不明且相關資料 也不完全,所以只取了78人來比較(中下棋士的對局資料很少)。下圖就是根據以上原則所做出來的分布圖:

  • 如上所述,中國棋士只取了排名在前的前78人,所以整體的分布也偏前。
  • 台灣棋士的眾數區間與日本棋士的眾數區間相同。但日本棋士的數量多很多,所以如果打人海戰術的話,會是日本棋士獲勝。
  • 就個分布來看,韓國棋士的平均分布也要高於日本棋士二子左右(差兩分)


生涯對局人數排行

該 站做的統計資料中,這也是一個相當有趣的排名。就是計算每一位棋士成為職業棋士後,生涯中會跟多少其他棋士下過棋。這個統計當然也是只計算日本棋士之前的 對局,不包含對上其他外國棋士的部分。想當然的,棋士生涯越長、頻繁參加各種預選賽或本賽的棋士就越容易增加對局人數,另外女性棋士彼此間很容易就會對 上。下表就是該站做出來的對局人數前十名(統計時間點也是2011年12月止):

排名
姓名
對局人數
杉內壽子
370
宮澤吾朗
348
工藤紀夫
344
楠光子
344
淡路修三
337
杉內雅男
335
茅野直彥
331
時本壱
330
佐藤昌晴
327
10
上村陽生
324


當然這個表中也有些好玩的地方:

  • 第一名的杉內壽子八段因為至今尚未退休,所以有和最近的棋士對局之經驗,棋士生涯又很長(超過七十年吧?),又很容易和女性棋士對上,所以大幅領先排名第二的宮澤吾朗。
  • 排名第三的工藤紀夫則有和吳清源、坂田、秀行、橋本宇太郎、篠原正美、半田道玄、前田陳爾等過去主要棋士對局過的輝煌紀錄。
  • 以趙治勳九段來看,雖然生涯至今已經和253人對戰過,但其中超過一半的對局數是集中和少數的17人所下的。

預期勝率非常低的獲勝實例

當然,這是以過去的統計資料來預測未來發生事件必然會出現的問題,就是會有跌破眼鏡的超低預期勝率獲勝的情形出現。這裡順便也介紹出來:

日期
棋賽
勝者
敗者
結果
勝者之預期勝率
2009/10/29
名人預選C
古庄勝子
秋山次郎
W+0.5
1.1%
2004/5/20
王座預選C
井上初枝
松原大成
B+R
2.5%
1984/5/31
碁聖預選
水野一郎
山城宏
B+R
2.7%
1994/3/9
天元預選一
中村邦子
小山龍吾
B+1.5
3.0%
1997/1/22
本因坊預二
森川正夫
張栩
B+2.5
3.0%


  • 排除不戰勝的結果、並且只看日本國內棋賽的結果。統計時間是1965年1月到2011年7月
  • 預期勝率是根據比賽當月的前一月日本棋士排行分數來計算的。
  • 在各大棋賽本賽中不太可能出現棋力相差巨大的情形(幾乎都是第一流的菁英),所以這些悲劇都出現在預選棋賽中。
  • 敗者幾乎都是很有名、或後來成名的棋士,而勝者也幾乎都是不見經傳的棋士,所以才會出現如此低的預期勝率。我們號稱面對實力有明顯差距棋士時絕對會確實獲勝的張栩年輕時不慎失足,也不幸地在這個榜上留名。