
维科网12月3日讯,亚马逊云科技(AWS)在当地时间12月2日举行的re:Invent 2025大会上宣布,其新一代人工智能训练芯片Trainium3及配套的Trn3 UltraServer系统正式投入商用。
该芯片是AWS首款采用3纳米制程工艺的AI芯片,旨在为生成式AI、多模态及视频生成等负载提供算力支持。
与上代相比,全面提升约4倍
根据AWS官方数据,Trainium3在关键性能指标上实现跨越式进步。
据悉,其单颗芯片可提供2.52 PFLOPs的FP8算力,并搭载144GB的HBM3e内存。
而Trn3 UltraServer系统,则由多达144颗Trainium3芯片集成,其整体FP8计算性能高达362 PFLOPs。
与上一代Trainium2系统相比,新系统的计算性能提升约4.4倍,内存带宽提升约3.9倍,能效比提升超过4倍。
已获多客户采用,成本减半
目前,已有包括Anthropic、Karakuri、Decart在内的多家企业客户开始使用Trainium3芯片。
在实际应用中,AWS称,Trainium芯片可帮助客户将AI模型训练和推理成本降低最高50%。
例如,AI视频公司Decart通过采用Trainium3,在视频生成任务中实现了比其他芯片高4倍的帧生成速度,同时成本降低了一半。
支持大规模扩展,未来兼容NVLink
为满足大规模AI训练需求,Trn3 UltraServer可通过EC2 UltraClusters 3.0架构互联,构建包含多达百万颗Trainium芯片的超大规模计算集群。
此外,AWS已预告下一代Trainium4芯片的研发计划。
而据其所言,Trainium4,将在设计上将支持英伟达的NVLink Fusion高速互联技术,以实现与英伟达GPU的协同工作。