• 最近访问:
发表于 2025-11-04 22:57:51 股吧网页版
中国大模型赢下AI投资大赛:阿里千问、DeepSeek盈利领跑 GPT-5垫底
来源:澎湃新闻

  六款全球顶尖AI(人工智能)大模型参与的实盘投资比赛落下帷幕,阿里千问最终反超DeepSeek获得冠军。

  当地时间11月3日下午5点,美国AI研究平台Nof1宣布,从10月18日开始的大模型实盘投资比赛Alpha Arena正式落幕。六名参赛者中,阿里千问Qwen3-Max最终凭借突破20%的收益率拿下了本届大赛的冠军,DeepSeek v3.1位居第二,账户金额比第三名高出3000多美元,两款中国模型也是全场唯二盈利的大模型。而来自美国的四款大模型全线亏损,OpenAI的GPT-5亏损超60%垫底。

  本次比赛集合了Qwen3-Max、DeepSeek v3.1、OpenAI的GPT-5、谷歌Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5和xAI的Grok 4这六大全球顶尖模型。在比赛中,为了衡量AI的投资能力,Nof1给每个模型账户发放了一万美元的启动资金,让它们通过Hyperliquid平台在真实市场自主交易数字货币。

  由于在整个比赛过程不能有人插手,意味着大模型需要自己识别买入机会、决定买入仓位、判断买点卖点,并且实时管理风险。在过程中,系统会不断向模型输入当前的账户状态、持仓情况、市场价格和技术指标,模型需要依靠这些信息做出动态判断。

  从图表中可以看出,六个大模型拥有三种投资风格:几乎全程占据第一梯队、轮流成为第一的Qwen和DeepSeek,属于“震荡派”的Claude和Grok,以及“稳定”在谷底的GPT-5和Gemini 2.5 Pro。

比赛结果。来源:Nof1

  在比赛过程中,DeepSeek的表现一直很“稳”,历史最高收益率一度达到惊人的130%。不过,在比赛结束前的最后关头,相对更加激进的Qwen凭借一次紧急避险反超了DeepSeek,以超过20%的胜率和12231.82美元的账户总额获得冠军。同时,GPT-5和Gemini 2.5 Pro的一万美元本金只剩下了40%左右。

  从过往交易的统计中可以看出,Gemini和GPT的买进卖出行为最为频繁,尤其是Gemini,有时持仓时间仅有数分钟;Anthropic的Claude和xAI的Grok则表现相对保守,持仓时间较长,交易数较少。

  Nof1表示,通过本季比赛,他们试图研究“在几乎没有人为指导的情况下,大型语言模型(LLM)能否直接作为一个零样本(zero-shot)系统化交易模型来使用”。

  初步实验结果显示,在使用相同的运行框架(harness)和提示词(prompts)的情况下,不同的大型基础模型在风险偏好、规划能力、方向性倾向(例如看多或看空)以及交易活跃度等方面,仍然存在显著差异。同时,团队还发现,这些模型“对看似微小的提示词改动非常敏感”。

  Nof1表示,很快将会举办下一季比赛,团队将引入多提示词、多实例、交易历史等机制,以增强模型的稳定性与评估深度。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500