一个德国人,连续猜对了最近三届世界杯冠军。他不是足球评论员,也不是博彩精算师,甚至不太看球员数据。他的模型里装的不是球星名字,而是人均GDP、人口规模、足球在一个国家社会中的位置。今年,他的预测指向荷兰。
这位德国经济学家叫约阿希姆·克莱门特(Joachim Klement)。2014年他的模型选中德国,2018年选中法国,2022年选中阿根廷,三届全部命中,无一失手。对于即将开赛的美加墨世界杯,克莱门特的结论是:荷兰将在决赛中击败葡萄牙,捧起大力神杯。
一个用经济和社会数据的人,凭什么预测足球比赛?
克莱门特供职于英国券商Panmure Liberum,他构建的预测模型包含五个变量:人均GDP、人口规模、气候、东道主身份,以及一个随机性因子。
人均GDP的逻
经济模型之外,还有其他人在用自己的方式押注答案。
美国统计学家、《信号与噪声》的作者纳特·西尔弗(Nate Silver),带着名为PELE的新模型登场了。他在传统Elo评分里嵌入球员市场价值,并引入了一个"Tilt"因子,即近几届冠军往往在前一届表现的基础上获得额外模型增益。PELE跑完10万次模拟后,给西班牙的夺冠概率约22%,法国18%,阿根廷12%,每日更新。三个热门与高盛的排序一致,但西尔弗对卫冕冠军阿根廷的态度比高盛更为积极。
科技媒体的做法更直接——Decrypt把同样的任务交给了七个AI模型,让它们各自预测世界杯冠军。结果是四个选了西班牙、三个选了阿根廷。
而比结果更有意思的,是分歧的源头。顺藤摸瓜查下去发现,分歧根本不在于足球分析水平的高低,而在于每个模型抓取的是哪个Elo评级源:选用实时足球Elo评分(西班牙排第一)的Opus、GPT、Stepfun、Nemotron,无一例外地把票投给了西班牙;而参考FIFA排名或俱乐部加权评分(阿根廷、法国、巴西均排在西班牙之前)的DeepSeek、MiniMax、Qwen,则更倾向于阿根廷。

7个AI模型的预测结果
中国AI公司也加入了这场竞赛。Kimi(月之暗面)调动了300个AI智能体,从战术、球员、赛程、历史等维度预测每一场比赛,甚至还专门设置了一个“反方组”,由一批与主流预测持相反意见的智能体专职寻找翻车风险。
Kimi的首期预测指向了一个出人意料的方向——德国可能“爆冷”夺冠。理由是:德国连续两届小组出局的“近因偏差”持续压低了市场定价,而穆西亚拉和维尔茨组成的新前场已经解决了此前的攻坚难题。38岁的主帅纳格尔斯曼恰好是将AI深度融入训练的代表人物,这一因素也被纳入了模型。
Kimi在官宣文章里开门见山:“我们的预测很可能是错的。”但他们把整个分析过程、预测结果和赛后复盘放在了同一套透明框架中,任凭外界检验。
此外,还有一条预测线索来自虚拟世界。6月初,美国艺电(Electronic Arts)旗下体育游戏品牌EA Sports基于FC 26游戏引擎完成了最新一届世界杯模拟。结果也将冠军指向了西班牙队。值得一提的是,EA Sports的模拟历史相当漂亮:2010年选西班牙、2014年选德国、2018年选法国、2022年选阿根廷,近四届全部命中。
至于真金白银的预测市场,则是另一套读数。截至6月9日,Polymarket平台上西班牙夺冠概率约16%,法国约16%,阿根廷约10%,前十之外的其余球队合计约占两成。与高盛26%的评估相比,市场对西班牙的信心明显更低——但市场定价是动态的,开赛后的每一场比赛都可能改变这些数字。预测市场的逻辑和经济学模型截然不同:后者的优势是“有道理”,前者的优势是“押注者真的会输钱”,因此会把各种隐性的场外信息也纳入定价。

Polymarket平台数据
这些模型预测得到底准不准?历史成绩称不上漂亮。
2022年卡塔尔世界杯前,高盛的模型把巴西排在第一(24%),阿根廷第二(21%),法国第三(19%)。最终阿根廷夺冠,巴西止步八强。高盛确实把冠军锁定在了前三名,但排序是错的——球迷如果按概率投注,恐怕输多赢少。
克莱门特连续三届命中,从纯概率角度看,即便每次猜对的概率只有25%,三连中的几率也不过1.6%左右——主要靠运气的可能性已经很小。但连续三届的样本终究有限,他的模型的“真本事”还需要接下来的比赛进一步验证。
模型自己也清楚这些局限。高盛在报告中列出了四类模型盲区:无法有效衡量非进攻端才能(如中场厚度和守门员点球价值),不考虑球员伤病状态和个人赛季状态变化,也难以捕捉主教练因素的潜在影响。报告结尾处的类比颇为直白:足球的内在不可预测性,使得统计显著性始终有限,这与押注高波动资产时的处境如出一辙。
Stepfun 3.7模型在二次修正之前,也跑出了一个荒诞的结果:排名前三的热门球队是墨西哥、南非和韩国。它的开发者没有遮掩这次翻车,而是公开解释了整个过程:用人工生成的预期进球数来拟合国家队数据,反而抹平了强队与弱队之间的真实差距,发现问题后干脆全盘推倒,改用纯Elo评分重建。
所有这些模型,本质上都在探索同一个问题:世界杯的结果,到底能不能被算出来?克莱门特说经济基础决定上层建筑,高盛说竞技实力见真章,Kimi说别忘了人是会犯错的。答案不唯一,就像即将在明日凌晨开幕的世界杯本身——48支球队、104场比赛,很快会给出它自己版本的答案。