AI大模型迭代发展,正为AI芯片市场带来持续演进动力。
近日,Arm推出Arm Lumex计算子系统 (Compute Subsystem, CSS) 平台,旨在为旗舰级智能手机及下一代个人电脑加速其人工智能 (AI) 体验。Lumex CSS平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能Arm CPU、GPU及系统IP。据悉,依托搭载SME2技术的Arm CPU,可实现五倍AI性能提升。
这背后折射的是AI落地终端趋势正酣。无论是AI对既往功能的升级,还是Agent探索落地,背后都依赖高效的端侧计算能力支撑。
此外,以混合现实(MR)眼镜为代表的新型AI终端也在兴起,打开更大一层应用空间。
Arm高级副总裁兼终端事业部总经理Chris Bergey接受21世纪经济报道记者专访时表示,他完全认同AI智能体将成为下一个新兴领域的行业观点。“我认为这个趋势将持续发展,因为随着技术演进,智能体将变得越来越智能。因此,我们能做的最佳选择是持续提升计算能力,并以高效方式进行实现。”
此外,针对火热的混合现实(MR)眼镜市场发展趋势、其与手机未来的发展关联等话题,Chris Bergey也提出了自己的见解。
100亿TOPS超级算力规划
据介绍,借助Armv9.3 CPU集群,Arm Lumex实现了两位数的性能提升。此外,在所有新推出的CPU平台上全面启用第二代可伸缩矩阵扩展 (SME2) 技术,尤其有利于音频生成、摄像头推理、计算机视觉或聊天交互等对实时性要求严苛的应用。
Chris Bergey在演讲时表示:“我们正将SME2技术扩展至每一个CPU平台。预计到2030年,SME与SME2技术将为超过30亿台设备新增超100亿TOPS的计算能力。”
这是Arm面向终端市场进行品牌更名后推出的首个产品系列。
今年5月,Arm首席执行官Rene Haas发文提到,公司推出了一套新的产品命名体系,其中针对移动终端市场的体系被命名为Arm Lumex。
对此,Chris Bergey对21世纪经济报道记者指出,“平台思维”而非“组件思维”才是此平台策略的核心理念。
“近年来我们发现,合作伙伴正向我们寻求如何将芯片设计从RTL(寄存器传输级)转化为实际芯片的技术帮助,这是我们推出CSS平台的初衷。但我们同时注意到,客户真正渴求的不仅是高性能硬件,更需要完整的软件栈协同运作,我们对Kleidi的投资以及所有开发者相关投资项目都体现了这一理念。”他进一步阐释道,Arm专注于如何将这些技术推向市场,如何与安卓等领先企业合作以确保这些方案的优化。正因如此,有必要推出全新品牌体系。
在大模型时代,从芯片到硬件这整条产业链之间的联动也愈发密切。
vivo高级副总裁、首席技术官施玉坚就指出,2024年vivo Arm联合实验室成立,成为首家与Arm成立联合实验室的终端品牌。
据介绍,vivo从2023 年就开始了SME2的场景研究和验证,分析测试各类AI任务,明确不同算法的最优硬件路径选择,实现软硬一体化设计。目前,vivo计算加速平台VCAP,已全面支持SME2指令集。
对于此番合作,Chris Bergey对21世纪经济报道记者指出,如今在科技界存在不同的生态系统,比如苹果生态系统,由他们自主研发芯片、构建处理器核心、再开发配套软件,形成全栈式生态系统。但在安卓生态或其它领域,仰赖的是多方协作以构建完整的技术栈。
若各方未能优化整体技术栈,这种模式在某些方面可能受限,但从某些角度看,反而更具潜力,也更加有利。
“因为,尤其在人工智能领域,我们正见证诸多新兴技术的涌现。市场中多元参与者催生大量创新。因此我们重视与vivo的合作:其中,Arm深谙如何打造更好的CPU和GPU,如何实现芯片的更好性能,懂得如何调动庞大的开发者生态系统,但我们并不了解某些具体的应用场景、用户真正关心的创新方向以及他们希望运行的AI智能体类型或前瞻性愿景。通过紧密合作,我们能帮助vivo了解技术可能性,而vivo也能协助我们洞察创新价值所在。”他分析道。
对于此次发布的新一代产品,Arm终端事业部产品管理副总裁James McNiven在受访时进一步分析,SME2是SME的新一代版本。“我们认为它非常适合移动设备,原因主要有两点:它新增更多指令集,可进一步提升性能和能效;支持更小的数据类型,包括2 bit和4 bit,随着每年高度量化模型不断增多,这类小数据类型在移动生态系统中的重要性日益凸显。这也是我们重点将SME2整合到Lumex平台中的原因。”
Chris Bergey强调,由于SME2直接集成到CPU中,在支持工作负载方面具备高度可扩展性。这意味着,SME2带来的AI功能不仅能应用于4000元以上高端手机,还能下沉到2000元等不同价位段的手机中,更大幅度推广AI技术落地。
打开更大AI空间
当然,早已步入发展成熟期的手机行业,近年来有增长驱缓的迹象。对此,Chris Bergey分析指出,从出货量角度看,手机行业的增长已趋于平缓。然而,可以发现,消费者在智能手机上对旗舰和高端市场的支出增长持续增加,这反映出用户对设备先进功能的重视程度日益提升。
“我们仍处于AI发展的初期阶段,而AI正带来巨大机遇。计算设备在人们日常工作与生活中的价值将持续上升,并将变得愈发不可或缺。这一趋势也将影响用户对价值的认知,以及他们愿意为新技术支付多少费用。”他强调道,AI前景广阔,但其对算力性能、内存带宽和功耗效率都提出了极高的要求。正是这些挑战推动着技术创新。“这也正是我们对未来增长与机遇充满期待的原因——AI正推动着更高的计算需求,并创造全新价值。”
从技术趋势看,今年被称为是“AI Agent(智能体)元年”,多家手机厂商自去年开始就已经在探索将智能体能力落地在手机中,这对芯片层面也提出了更高要求。
Chris Bergey对21世纪经济报道记者指出,在此趋势下,Arm能做的最佳选择是持续提升计算能力,并以高效方式进行实现。
“我们在CPU性能提升方面进行了重大投入,合作伙伴也将充分利用NPU优势——这本质上是全平台协同的战略布局,同时兼具开发者友好性,虽然部分智能体可能由手机制造商开发,但多数需求来自大型第三方供应商。”他表示。
例如支付宝方面就指出,在Arm、支付宝与vivo三方协作下,支付宝已在vivo新一代旗舰智能手机上完成了基于Arm SME2技术的大语言模型推理验证。结果显示,在预填充(prefill)与解码(decode)阶段的性能分别有超过40%和25%的提升。
因此,Chris Bergey表示,这类第三方供应商寻求的是不受限于单一手机制造商或芯片公司的广泛布局。正因如此,由于Arm有广泛覆盖能力并能实现跨生态系统赋能,这类供应商也高度重视与之的合作。
除手机终端外,混合现实(MR)眼镜市场也在今年逐渐走向爆发,这背后少不了来自Arm提供的算力支撑。不过,目前为止Arm还未对该细分市场推出具体CSS平台。
Chris Bergey对记者分析道,智能眼镜设备行业的确充满活力。对此,公司通过Arm Lumex平台的各个组件开展了大量工作,包括推出Arm C1-Pro、Arm C1-Nano CPU以及全新的GPU产品,可供客户灵活选择。
“我认为市场需求仍在演变中,至于客户需求是怎样,会很大程度上依赖于具体产品的型号、设计等。当前我们的策略是与领先客户深度合作,确保工作负载匹配精准。若该市场的未来演变出对CSS平台的需求,我们自然会顺势而为,但并非现阶段的重点。”他进一步指出。
对于MR眼镜的产业生态发展,Chris Bergey分析道,XR的吸引力在于它能提供某些服务。大型语言模型尤其令人兴奋,因为最初构思智能眼镜时,因为光学系统和显示屏等技术的重重限制,让传统的用户界面在眼镜设备上实现难度极高。如今有了大型语言模型,用户界面将迎来变革,将使设备更贴合用户需求,这正是XR技术突破的关键。
“此外,我认为手机仍将在这个生态系统中扮演重要角色。”他指出,受限于功耗等因素,从眼镜直接连接云端可能不现实,需要借助某种中间计算单元——可能是手机,也可能是专用设备。“因此我们首要关注的是:如何在设备功耗预算极有限的情况下,实现最大化的计算能力。我认为Arm在该领域已占据优势地位。当前我们正着力于生态系统层面,充分利用手机的普及优势,实现某些必须在本地而非眼镜端完成的处理任务。”
正由于大模型技术仍在演进,AI芯片产业链厂商也需密切关注其路线图,以更好适配计算需求和能力。
对此,Chris Bergey对21世纪经济报道记者指出,随着AI大模型技术的发展演变,模型中的种种元素也在不断发生变化。
“CPU的精妙之处在于其极致的灵活性,这使我们能充分利用诸多创新成果并提供最大程度的适配性。随着这些创新逐渐标准化,AI加速处理成为可能。因此我认为Arm的核心价值在于提供终极灵活性,帮助开发者施展创意与能力,拥有更广大的创新空间。随着模型日益精简高效,在CPU上运行也变得越来越具吸引力。”他分析指出。