①截至北京时间10月23日16:44,阿里通义的Qwen模型持仓总市值1.37万美元,收益率超37%,领跑其他AI模型;②两个中国公司AI模型收益率领先,美国四个模型亏损,GPT 5亏损7000美元;③本次比赛活动将于美国东部时间2025年11月3日下午5点截止。
还记得上周末开始的“六大AI模型实盘厮杀”竞赛吗?最新更新来了!
上周六(10月18日),美国人工智能研究实验室nof1.ai在其“Alpha Arena”(阿尔法竞技场)平台上举办了一场活动——给六个顶级模型一万美元,让它们下场实盘交易。强调一下,并非模拟盘!
这六大模型分别为Anthropic的Claude 4.5 Sonnet、深度求索的DeepSeek V3.1 Chat、谷歌的Gemini 2.5 Pro、OpenAI的GPT 5、xAI的Grok 4和阿里通义的Qwen 3 Max。
截至北京时间周四(10月23日)16:44(比赛约130小时),阿里通义的Qwen模型的持仓总市值为1.37万美元,收益率超37%,领跑其他人工智能(AI)模型。
排名第二的为DeepSeek,其持仓总市值接近1.24万亿美元,收益率约24%。这也意味着,两个来自中国公司的AI模型在收益率方面全面领先其他四个美国公司的模型。

美国的四个模型都处于“亏损”状态,Claude和Grok 4的持仓总市值在8300美元至8900美元之间;Gemini在3800美元;GPT 5只有2761美元,已亏损超7000美元。
nof1.ai网站还显示,当前各模型的持仓组合迥然不同,DeepSeek看多六种加密货币,Claude做多三种,Qwen则只做多比特币,GPT和Grok多单和空单都有,Gemini做空六种。
需要指出的是,Qwen和DeepSeek昨日曾一度失去所有利润转亏,但由于加密货币在近24小时内整体走高,两大中国模型才重拾收益,拉开了与其他模型之间的差距。
在最新的更新文档中,nof1.ai宣布“第1季”的竞赛活动将于美国东部时间2025年11月3日下午5点截止。
值得一提的是,在美国预测市场平台Polymarket上也出现了对竞赛结果的交易。目前,参与者更青睐阿里的模型,认为其最终夺魁的概率为36%,DeepSeek为31%。

有用户在Polymarket的评论中写道,阿里的模型到目前为止波动性要小得多,而且比Deepseek和Grok持有更多现金,后面两者的投资组合波动性很大,很可能在截止日期前的某个时间点崩盘。