蒙地卡羅法與團隊討論賽
大橋:
這次的圍棋高峰會的第二天舉辦了AI的研討會,有非常多關於最先端技術的演講,也談到了阿發夠強化的部分。雖然說了很多關於深層學習的學習故事,但就是沒有特別提到蒙地卡羅法。據說是只要利用深層學習來強化計算網路,就不需要再用到蒙地卡羅法了。雖然阿發夠還是有在使用蒙地卡羅法,看起來其影響性是變小很多了,不知道大家怎麼看?
王:
我覺得的確是使用率降低了沒錯,但團隊討論賽的終局階段局面(D圖),明顯是蒙地卡羅法造成的影響吧?
D圖 黑 中國世界冠軍隊 白 阿發夠
孔:
那真是太好笑了,因為黑1點時,白棋根本沒必要補。
大橋:
那應該是唐韋星九段在投降前想測試看看阿發夠是不是還會放鬆吧?
王:
不用蒙地卡羅法的新版本到底會變成甚麼樣的架構,實在是很令人好奇啊。根據股溝方面的說法,將來會發表到底這版的阿發夠是怎麼變強的,這也很令人期待呢。
大橋:
說到團體討論賽,對我個人而言,這是最可惜的一盤棋。
孔:
老實說,就是被打得落花流水啊(笑)。
大橋:
很明顯五個人的意見一直合不起來。
孔:
五位成員既然都是曾經拿過世界冠軍的高手,就會有各自的思考風格,彼此又對於自己主張非常堅持,步調自然就會亂掉。
王:
不管是誰來下都會變成這樣吧?
孔:
我在想,基本上就是一個人主下,只有希望其他人能夠一起幫忙算的時候,其他人才出手相助,這樣是不是會比較好?
王:
沒錯。
大橋:
以前我在大學裡開圍棋課時,也曾讓學生下過討論棋。由三人組成的團隊中雖然每位成員的棋力都差不多十級而已,但經過好好討論下,竟然能連續下出三級左右棋力的棋來,真的讓我很吃驚。我想恐怕是這次參加團隊討論賽的成員下這種賽制的經驗很少的關係才會這樣,如果整個團隊的默契能配合起來,應該能夠連續下出更有效果、更高水準的棋才對。
王:
我覺得蒙地卡羅法就像是這樣,單純就是用類似少數服從多數的方法,就讓棋力進步起來了。
大橋:
我覺得該怎麼決定著手的方法是非常重要的。這次的團體討論賽中,人類團隊雖然下的不理想,但我覺得如果人類團隊能發展出好的表決方式,則可能會讓我們看到更有趣的棋才對。其實這樣的問題不僅是發生在圍棋上,好比說將來的時代可能會變成一家公司的經營等事項,也會是由一群人一起來檢討AI給的意見。但如果那時沒有找到好的檢討方法的話,可能就會做出比沒有AI更糟的決定。所以怎樣找出人類的判斷與意見表決方式,會是未來的一大課題。
王:
就這樣來看,這次的團體討論賽可說是一個很好的示範模型呢。
===
相關系列文章:
沒有留言:
張貼留言