由GitHub用户martj42编制的数据库记录了自1872年以来每场足球比赛的详细结果
原创 文摘菌 大数据文摘
大数据文摘出品
作者:Caleb
世界杯赛程来到第11天。
相信昨晚阿根廷的球迷都捏了把小汗,虽然整场下来阿根廷全场围攻,共计23脚射门,但错失了太多机会,包括梅西的点球,但好在下半场攻势迅猛在开场拿下1球后乘胜追击,最终2-0击败波兰队。
本场比赛也使得梅西超越马拉多纳,成为阿根廷历史世界杯出场最多的球员。
小组赛继续爆冷。在D组最后一轮比赛中,突尼斯队以1:0战胜开场派出非主力阵容的法国队,但位列小组第三无缘小组出线,法国队以小组头名身份晋级16强。
虽然本届世界杯进行到此尚未过半,但关于本届世界杯冠军的预测却早早拉开了序幕。
会是传统强队巴西法国?还是有黑马杀出?
章鱼保罗光荣退休后12年,可能章鱼哥自己也没想到,自己的衣钵竟然被AI继承了。
让我们来看看AI对于本届世界杯冠军的预测是怎样的吧~
对模型和数据库进行优化
艾伦图灵研究所(The Alan Turing Institute)的三位研究员Nick Barlow、Jack Roberts和Ryan Chan开发了一种统计模型。
该统计模型基于2018年一个衍生于《英超范特西》的模型AIrsenal,而AIrsenal又借鉴了Dixon和Coles于1997年推出的足球预测经典模型。
经典模型主要从球队攻击强度、防守强度和主场优势出发,使用贝叶斯统计计算比赛中最有可能得分获胜的球队。
为了让AIrsenal在预测国际比赛结果上更有参考价值,研究人员引入了不同洲的相对实力参数。
除此之外,研究人员在训练模型时也采用了更为全面的数据库。
由GitHub用户martj42编制的数据库记录了自1872年以来每场足球比赛的详细结果。数据把比赛的权重也做了一些区分和排序,比如世界杯正赛(2002年之后)和近期比赛要依次大于洲际锦标赛、预选赛和友谊赛。
GitHub链接:
https://github.com/martj42/international_results
研究员还将FIFA官方排名输入到模型中,以提供对球队表现的最新估计。
今年冠军究竟会花落谁家?
在100,000次模拟之后,AI也给出了自己的预测。
毫不意外,巴西队一如既往成为第一大热门,在25,000次预测中都登顶了本届世界杯,夺冠率高达25%。
紧随其后的是传统强队比利时和阿根廷,夺冠率达到了18%和13.5%。
如果你觉得现在谈决赛和冠军还有点太遥远,我们来看看近期的比赛结果预测。
就11月29日英格兰对阵威尔士的比赛来说,AI给出的结果是,英格兰有大约80%的概率会从小组赛中出线,进入1/4决赛或决赛的概率则为60%,而最终夺冠的概率只有7%。
反观威尔士,威尔士队有50%的概率会出线小组赛,但进入决赛的概率只有2%,夺冠概率则只有0.5%。
就本届世界杯目前表现来看,英格兰队1胜1平积4分,暂列小组第一。首轮6-2轻松击败伊朗后,却在次轮对阵美国时表现平平。总的来看两轮比赛下来,英格兰还是比较顺,体能消耗也不是很大,但问题是球队的阵容还没有面临真正的挑战。在淘汰赛前的最后一场小组赛,英格兰肯定需要更多的精力去面对比赛。而威尔士整体实力虽有贝尔和拉姆塞镇场子,但其他人因为年龄和伤病,实力明显不如从前。
同时从两队交手103次的历史成绩来看,英格兰68胜21平14负占据了绝对优势。
而最终结果来看,英格兰以3:0的大胜为小组赛收官,同时他们也以2胜1平的战绩排名B组第一,携手1胜2平的美国队出线。
巴西队深受AI欢迎
除了艾伦图灵研究所的模型之外,还有很多预测模型都对本届世界杯给出了自己的预测。
比如博主@JackCuiAI在统计了1872年-2022年间的国际足球比赛数据和1922年到2022年间的国际足联世界排名数据,并对这些数据进行了分析,提取了影响比赛的包括排名、主客场、射门次数、扑救次数、最终比分等关键特征之后,使用集成学习梯度提升决策树Gradient Boosting Classifier给出了自己的预测。
在前四场卡塔尔-厄瓜多尔、英格兰-伊朗、荷兰-塞内加尔和威尔士-美国比赛中,AI给出了与实际结果完全一致的预测,甚至包括小组赛比分和各队积分。
根据AI预测,本届世界杯8强将会是荷兰、阿根廷、西班牙、巴西、英格兰、法国、比利时、葡萄牙,最终决赛会在巴西和葡萄牙之间展开,而最终巴西将捧起队史第六座世界杯冠军奖杯。
看来,巴西队果然是深受AI欢迎。
来自多特蒙德工业大学、慕尼黑工业大学、卢森堡大学等高校的联合研究团队也结合多个表示球队实力的统计模型与球队结构(市场价值或欧冠球员数量)和原籍国社会经济因素(人口或国内生产总值)等信息,给出了世界杯预测。
巴西队以15%的夺冠率高居榜首,进入决赛的概率也有23.5%;阿根廷紧随其后夺冠概11.2%;夺冠热门第三为荷兰队,夺冠率为9.7%;德国、法国位列第四和第五。
研究团队此前的预测的准确率都相当高,比如2008年和2012年的欧洲杯冠军、2010年的世界杯冠军等。
但是多特蒙德工业大学统计学教授格罗尔也表示,预测可能存在错误,否则足球比赛将变得非常无聊。
“我们提供的只是概率,而不是确定性,15%的夺冠概率也意味着85%的失败概率。”
是啊,球场上的不确定性才是最吸引人的,你说对吧梅西
相关报道:
https://www.turing.ac.uk/blog/can-our-algorithm-predict-winner-2022-football-world-cup
原标题:《AI看了10万次世界杯后,预测巴西将捧起队史第六座冠军奖杯,夺冠率高达25%!》
阅读原文