“大家对智能体的期待是零差错——但从技术发展曲线来讲,这个预期可能过高,技术仍然需要时间打磨,这是自然规律。”
近日,在2026北京智源大会上,面壁智能CEO李大海在接受澎湃新闻等媒体采访时表示,2025年是智能体元年,未来智能体将迎来爆发式增长,乃至深刻影响人类社会,不过在技术水平上,目前仍然需要冷静对待。
大模型到智能体的结合正在以非常快的速度进化,某些场景已经在落地,不过,谈到智能体的局限性,李大海直言:“哪哪都出问题。”
“模型和Agent(智能体)技术的进化非常快。”李大海认为,“也许今天有些工作10%是错误的,下个月错误率就降到1%,快速进化已经成为核心趋势。”
作为主攻端侧模型的AI公司,相比通用的基座超大模型,面壁智能或许更多着力的是“小模型”。
针对行业内普遍存在的“做好小模型必须从超大规模基础模型蒸馏而来”的观点,李大海明确表示这是一种认知误区。
“蒸馏背后有一个非常具体的前提:蒸馏的客体本身必须是一个好的模型。”李大海解释道,“蒸馏本质上是:对于不具备自研基础模型能力、但希望做应用落地的公司,采用已有的小尺寸基础模型,通过微调获得特定场景能力的过程。这个过程中,确实可能使用其他大模型合成数据来让小模型获得相应能力。”
李大海表示,这是所有大模型训练的范式,并不仅局限于小模型。
“今年以来,随着行业整体把推演转移到国产芯片上,我们也在逐步把训练工作转移到国产芯片和国产集群。”李大海介绍。
这一转变的背后,是对生态配合更高要求的挑战。在李大海看来,国产算力生态的完善正在两条路径上并行推进:第一条路径是自下而上的打磨——大模型公司通过自身的训练实践逐步完善生态,“就像一点一点把石板打湿一样,需要时间”。
第二条路径则是自上而下的顶层规划,例如此前面壁与智源研究院主导的FlagOS软件生态的深度合作:作为大模型公司和芯片公司建立深度合作,在规划下向前推进合作。
在面壁智能AIInfra负责人李宇轩看来,推理对精度的要求其实比训练更高,而面壁智能提出的模型缩放技术成为破局关键:实现用很小的模型预测大模型的效果,在国产芯片上提供深度评测,将实验细节与海外厂商对齐,确认训练精度可用。
据披露,面壁智能已经在华为平台上实现极低位宽量化感知训练,达到普通训练95%的效率。李大海解释,5%损失来自量化器本身的开销,通过与华为深度合作,这一开销已经被优化到极小。
在小模型性能方面,面壁智能公布最新进展:MiniCPM小钢炮第五代1B版本在ArtificialAnalysis(AA)权威评测中获得17.9分。开源社区研究人员对比发现,2024年5月发布的GPT-4o(200B参数)在同类评测中得分为18.3-18.6分,二者仅相差0.4-0.7分。
“2024年我们曾预测,到2026年底端侧模型智能水平可达到GPT-4级别。从目前数据看,这一目标已经提前实现。”李大海表示。
值得注意的是,在此前的“面壁智能开源周”上,面壁智能接连发布MiniCPM5-1B、BitCPM-CANN两款端侧大模型。其中,MiniCPM5-1B再次刷新模型的智能密度上限:仅以1B参数规模,在国际知名榜单AA-Index上超越了所有2B参数以下模型;相比3个月前发布的Qwen3.5-2B,MiniCPM5-1B不仅效果更优,参数量还减少了一半。
该模型由面壁智能自主研发的AI训练框架ForgeTrain预训练完成,其是全球*完全由AI编写的生产级大模型预训练框架,无人类程序员参与,训练速度比英伟达Megatron快10%。