AI對世足賽結果的預測
台大電機系 陳明佑 編譯
運用集體智慧的Swarm AI
Swarm A.I.是由美國公司Unanimous A.I.所開發,曾經正確預測時代雜誌的年度人物、奧斯卡獎得主,與一場超級盃賽事比數,可說戰功彪炳。Swarm A.I.字面上翻譯為「群體人工智慧」。其基本概念,來自動物界的集體智慧(collective intelligence)現象。在螞蟻、蜜蜂、鳥類等群體動物中,即使每個個體都沒有足夠能力做出複雜決策,然而通過合作與分工達成複雜任務,使得整個群體看似一個擁有單一思維、高度智慧的個體。
Swarm A.I.也是一個仰賴群體做出決策的系統。當Swarm A.I.要對一系列事件進行預測時,其後團隊會負責找到該領域的專業人士,例如在預測超級盃時,共諮詢40位資深球迷。在參酌每人意見後,經由特定演算法整合出一份最終預測結果。
本次世足賽預測,則與英國公司Colossus合作,由該公司提供足球領域的幾位專家,再經由演算法整合每個專家的意見,形成一個「大腦們的大腦(a brain of brains)」。預測重點如下:德國將擊敗巴西衛冕世足賽冠軍;西班牙和法國將在季軍賽交鋒並獲勝;上屆亞軍阿根廷本次將無緣四強。
當然,這並不是一個純粹由機器做出的預測。是否可視為人工智慧?恐怕仍存在爭議。
新隨機森林演算法
由德國、比利時等地的跨國團隊開發的人工智慧,則參酌了三種傳統常用模型:蒲瓦松回歸(Poisson Regression)、隨機森林(Random Forest)與排序法(Ranking Method),仔細評估各自預測表現與使用時機,最終提出了一套新的混合演算法。
隨機森林是近年相當熱門的機器學習演算法。其中「森林」,是指它運用多個決策樹;「隨機」則是每個決策樹選擇的是不同的變數集合。一般的決策樹模型是利用統計資料,透過評估資料中各項變數對結果的影響,進而生成一個分類器,用以計算任一結果的實現機率。
然而,由統計數據訓練出來的模型都存在一大缺陷─過適問題。也就是機器所預測的結果「太像是過去的統計數據」,而失去預測新事件的能力。新的隨機森林正是為了解決過適問題而誕生,藉由產生多棵決策樹,並選擇資料中不同的變數集合,各自做出預測。最後,統計不同決策樹的預測結果,計算出特定情境的發生機率。因為有多棵樹的參與,排除了過適與偏見的產生。
排序法則參酌如FIFA、各家博弈公司對各隊伍的排序數據,以推斷各隊實力。將排序法產生的數據加入隨機森林模型,以最佳化人工智慧的預測效力。
經過十萬次模擬後,結果顯示:巴西奪冠希望最高;德國則以2%機率緊追在後。另外,如果單看隊伍勝率不考慮賽程(因對戰組合也會影響排名),則以西班牙勝率最高。
預測結果
很不幸地,兩個人工智慧都沒有太好的表現,畢竟德國與冠軍早已無緣。不過,由Swarm A.I. 所預測的分組積分賽結果,在幾個組別上完美吻合,十六強也中了十三強。隨機森林算法預測的結果,十六強更是中了十五強。
投資管理公司Golden Sachs的A.I.亦對世足賽做出預測:決賽將由巴西對上德國,而巴西有望奪冠,地主隊俄羅斯則將在分組階段淘汰。單看隊伍勝率,法國隊則高居第二。然而,它們除了一樣沒能料到德國提前出局,對於俄羅斯的預測也是差強人意:俄羅斯在睽違數十年後,重新進入八強。
世上少有如運動競技如此迷人之物。即使到了未來,科技與社會的大幅變化似乎改變不了群眾那份隨之沸騰的一腔熱血。7月15日的決賽將決定本屆世足賽冠軍。本文介紹的兩組AI,都有了各自的預測:分別是德國隊與巴西隊。至於結果如何,就交由讀者你來驗證了!
參考資料
- A. Groll, C. Ley, G. Schauberger and H. Van Eetvelde, “Prediction of the FIFA World Cup 2018 – A random forest approach with an emphasis on estimated team ability parameters“, Arxiv.org, 2018.
- A. Zeileis, C. Leitner and K. Hornik, “Probabilistic forecasts for the 2018 FIFA World Cup based on the bookmaker consensus model“, Econpapers.repec.org, 2018.