上周,OpenAI的o3模型在人工智能(AI)国际象棋比赛中击败了xAI的Grok 4,赢得了冠军。
该比赛名为“人工智能国际象棋表演赛”,在谷歌旗下的Kaggle平台上举行,八个AI模型在三天淘汰赛中决出冠亚季军。
比赛要求AI模型要在未经任何专门训练的情况下下棋,只能在赛前从互联网上获取一些国际象棋知识。
在决赛中,OpenAI的o3以4-0的比分战胜了Grok 4,取得冠军。值得一提的是,o3在三场比赛中的比分都是4-0,还在半决赛中横扫了同门的o4 mini。

另一方面,Grok 4也在决赛前显露了强大的实力,先后淘汰了谷歌的Gemini 2.5 Flash和Gemini 2.5 Pro。当时,埃隆·马斯克还吹嘘xAI“基本没在象棋上花功夫”。

国际象棋对弈网站Chess.com的总编辑Pedro Pinhata在报道中表示: “直到半决赛,似乎没有什么能够阻止Grok 4赢得比赛。但这种幻觉在比赛的最后一天破灭了。”
解说嘉宾、国际象棋大师中村光(Hikaru Nakamura)在直播中表示,“Grok在比赛中犯了很多错误,但OpenAI没有。”
另一位解说员,国际棋联世界排名第一的芒努斯·卡尔森(Magnus Carlsen)评论道,决赛中这两个AI的水平均相当于刚学会规则的普通棋手——大约800ELO(等级分)。
根据世界国际象棋联合会的数据,卡尔森的ELO达到2839,第二名为上文提到的中村光,其ELO为2807。
卡尔森称,这些模型的棋艺时好时坏,它们更擅长计算吃棋子,而不是真正将死对手——它们懂得物质优势,却不懂如何取胜,“这就好比擅长收集食材,却不会做饭一样。”
需要指出的是,2019年击败韩国棋手李世石的AlphaGo,以及上世纪击败国际象棋大师加里·卡斯帕罗夫超级电脑“深蓝”都是专门为围棋和国际象棋打造的程序。

年内早些时候,在国际象棋大师Levy Rozman举办的另一场锦标赛中,Grok和ChatGPT都输给了专为国际象棋打造的人工智能系统Stockfish。