过去两周多的时间里,阿里通义千问陆续开源了六款模型。在这应接不暇的开源狂欢中,某AI公司的技术研发人员董铭(化名)却感到有些心力交瘁——他默默关掉了一个刚部署几天的测试集群,因为随着新模型的开源,应用程序接口又变了,而这已经是他近期第四次重写模型调用脚本。
最近,此前有些沉寂的中国大模型又重新热闹起来,无论是互联网大厂还是初创公司,都紧锣密鼓地发布了新模型,颇有2023年“百模大战”的味道。但不同的是,这一次的大模型浪潮以开源为核心,近期更新模型的公司都选择了开源的路径。与此同时,据全球知名AI开源社区Hugging Face近日公布的榜单,排名前十的开源大模型中,中国占据了九席。
中国的开源大模型正以“集群式”的崛起,重塑全球AI版图。但这在加强中国技术影响力、加快AI应用和普及的同时,也存在着隐忧。一方面,开源模型频繁迭代,但本质依然是基于主流Transformer架构的微调,能力差距并未拉开,有陷入“微调内卷”与同质化困境的倾向。另一方面,对于开发者来说,开源模型的爆发虽然提供了各式各样的工具,但也带来了反复调试、兼容成本高等挑战。
中国大模型“横扫”开源榜单
作为AI大模型大战的两个不同方向,开源与闭源孰优孰劣历来存在争议。开源是指开放源代码,允许用户修改、使用、分发,闭源则是指源代码不公开,用户仅能通过接口调用功能。
今年以前,我国大模型虽也“百花齐放”,但开源与闭源呈现势均力敌的状态,直到DeepSeek火爆出圈,国产大模型才走到了一个分水岭。业界普遍认为,DeepSeek的成功是开源的胜利,让所有人直观感受到了开源的影响力。于是,更多的中国公司选择效仿DeepSeek,转向开源路线,并将工作重点重新转向模型的优化与更新迭代中来。
今年7月底,国产大模型再次迎来了一轮开源“井喷潮”:7月22日起,阿里以“日更”的节奏,连续发布4款开源模型;7月27日,腾讯开源了混元3D世界模型1.0;7月28日,智谱发布了专为智能体应用打造的开源模型GLM-4.5;7月31日,AI大模型“六小虎”之一的阶跃星辰正式开源新一代基础大模型Step-3……
与此同时,Hugging Face在7月31日公布的榜单显示,排名前十的开源大模型中,中国占据了九席。其中,智谱的GLM-4.5排名第一,阿里的通义千问系列大模型更是独霸5个席位,同时上榜的还有腾讯混元大模型、月之暗面的Kimi K2大模型等。自年初至今,DeepSeek和阿里被外界称为“开源双子星”,Kimi K2发布后被《自然》杂志称为“又一个DeepSeek时刻”……中国开源大模型迎来了集体爆发的时刻。
“这一现象标志着中国AI从‘技术追赶’迈向‘生态主导’,核心驱动力源于‘数据—算力—场景’构筑的强劲闭环优势。”天使投资人、资深人工智能专家郭涛在接受证券时报记者采访时表示,我国开源大模型强势崛起,一方面,是由于我国大模型厂商依托海量优质中文语料,深度挖掘垂直应用场景,构建起了特色鲜明的差异化训练数据集;另一方面,以华为昇腾为代表的国产化算力底座日趋成熟,为大规模分布式训练奠定坚实基础,叠加开源社区的飞轮效应,头部企业开放代码汇聚众智,从而形成了良性循环的正向反馈。
先发者与后发者的路径分化
8月2日,国际知名大模型评测平台Chatbot Arena更新了最新一期榜单,阿里旗下最新开源的千问3超越了Grok4、Claude4等闭源模型,位列总榜全球第三,仅次于谷歌与OpenAI旗下的闭源大模型。
与此同时,作为开源模型领域的先驱,Meta创始人扎克伯格在一封公开信中表示,Meta会“谨慎选择开源内容”,这被视为Meta转向闭源的一个信号。这意味着,在中国大力拥抱开源模型的同时,闭源模型成为了美国科技公司的主流选择,发展路径已出现明显分化。
“AI的先发者必然倾向于闭源,因为先发者要巩固自己的优势,保持独特性,比如OpenAI就是从开源逐渐走向闭源;而后发者必然倾向于开源,因为只有开源,才能打破闭源者构建的生态。”工信部信息通信经济专家委员会委员盘和林在接受证券时报记者采访时表示,作为后发者,我国发展AI最佳路径就是开源,只有开源模式可以不断优化,吸引全世界开发者帮助研发算法来适配应用场景,从而获得广阔的应用生态支持。
一名人工智能资深专家告诉记者,美国的AI产业由资本驱动,有较强的资本回报预期,其盈利诉求导致AI大模型企业往往先追求技术领先,形成一定垄断后再创造巨额利润,使其倾向于选择闭源路线。但对于中国大模型厂商而言,唯有凭借开源的技术透明性,才能迅速在全球范围内获得信任,建立自己的开发者生态。“开源是一种产业优先的路径,通过开源降低使用门槛,让大模型加速成为与实体经济融合的基础设施。”该人工智能资深专家表示。
但开源并不等于放弃盈利,事实上,目前不同的模型厂商都有各自的盈利探索。比如,智谱以开源吸引更多的开发者,同时也向企业和政府客户提供付费的定制化解决方案;阿里则是通过打造强大的开源模型,吸引开发者使用其云计算等基础设施,通过云服务获取收益。
“开源模式如利刃破局,打破技术垄断壁垒,让中小企业能以低成本调用前沿模型,加速AI在智能制造质检、金融风控等领域的落地。”郭涛说,当闭源模型采取API(应用程序接口)收费模式时,中国开源模型通过微调定制服务、云平台分成等路径实现盈利,推动了AI技术的普及和应用。
光环之下的隐忧与挑战
开源模型越来越“卷”,这是今年以来从业者的普遍感受。各个厂商迭代模型的速度越来越快、版本越来越多,一个模型“登顶”之后很快又会被新的模型超越,看似是在参数性能、评测分数上“你追我赶”,实则是缺乏颠覆式创新之下的“微调内卷”与同质化困境。
“开源也好,闭源也好,所有领先模型都是基于谷歌发明的Transformer,在这个基础架构上再创新,如此而已。”开源中国董事长马越表示。前述人工智能资深专家表示,国产模型在开源榜上领先,体现的是国内厂商在算法工程化、推理性能、成本优化等方面的实力,大多数模型进步是依赖工程调优,而不是像Transformer那样的训练框架及算法创新。
硅谷基准风投公司合伙人Bill Gurley曾评价,中国开源模型之间可以互相改进,产生的组合效应非常强大,推出新模型变得更容易。但技术壁垒上的不足,导致新模型虽然愈发频繁地推出,但能力差距并未拉开。对于开发者而言,开源工具虽多,却面临密钥管理割裂、版本迭代失控等问题。
“通义、DeepSeek、GLM,每个模型都有各自的控制台和密钥。而且模型更新频繁,接口经常变化,给集成工作带来不少困扰。”董铭表示,为了快速验证新模型,开发者往往不得不反复部署临时集群,当模型更新节奏超过开发速度,开源狂欢某种程度也成为了“甜蜜的负担”。
在郭涛看来,模型高速迭代催生技术突破的同时也暗含着隐忧,不仅会带来兼容性危机,版本更迭过频导致下游应用适配成本激增,同时也可能存在创新空心化倾向,多数工作停留在参数调优,缺乏底层架构突破。对此,需推动统一API接口标准,激励开展原创性基础研究,规避低水平重复建设。
盘和林认为,靠“微调内卷”实现进步是AI基础算法突破乏力导致的,要真正引领AI范式,基础模型算法创新和算力芯片突破是绕不过去的两大门槛。“未来,需要建立中国AI的基础算法知识分享圈子,通过圈子内的相互启发,来推动中国AI算法思想的创新。”盘和林表示。