近日,在新一代计算标准工作委员会主办的“新一代计算产业大会”上,中科驭数(北京)科技有限公司(以下简称“中科驭数”)CEO鄢贵海带来题为《数据处理器(DPU)构建新一代AI网络的优势与关键技术》的主题报告。
“之前我们做过一个比喻:如果把CPU比做大脑、那么GPU就好比是肌肉,DPU是神经中枢。CPU承载了应用生态,决定了计算系统是否可以通用;GPU提供了大量不同精度要求的算力,决定了系统是否有足够的‘力量’;DPU负责数据在各种CPU和GPU之间高效流通,决定了系统是否能协同工作。”鄢贵海表示。
他认为,随着人工智能的快速发展,传统计算架构已经无法满足海量数据的处理需求,基于DPU高速网络的新一代计算架构成为提升效能的关键。DPU通过卸载GPU的计算负担、优化数据预处理、加速通信和存储任务,正成为大模型训练和推理的重要助力?
鄢贵海提到,DPU从诞生之初,就带着网络基因,并且天生倾向于通过数据加速处理来优化系统的性能,通过全栈协议支持对CPU屏蔽网络的多样性和网络传输天然的不可靠性。当前国际上DPU的代表性厂商有AMD、NVIDIA、Intel、Marvell等,这些厂商都把DPU当作一条重要的产品线来对待。但凡之前涉及高速网络业务的厂商,大都会斥巨资投入DPU的研发或并购DPU。
当前,中科驭数聚焦于高速网络数据处理芯片的研发,旨在解决计算节点间远程资源访问本地化、硬件资源虚拟化、数据安全内联化、系统运维一体化过程中所面临的挑战。
随着AI时代对算力的爆发式需求,通用计算、智能计算、高性能计算走向融合,在平台层面云原生叠加上AI原生,使得对网络的核心需求已经不仅是互联互通,而是网络与计算一体化、即“算网融合”发展。DPU在继承传统网卡功能的基础上,承载AI原生和云原生衍生的核心需求,以极高的性价比和网络线速处理能力来解决数据传输带宽、延迟、运维、安全等核心问题。
为了适应并推动计算机体系结构的变革,中科驭数自主研发了通用DPU的芯片架构,在继承传统网络处理器的基础上创新了针对AI和云原生场景下的低时延、高带宽属性和灵活的应用卸载能力,其传输层兼容以太网,可以平滑切入广泛的应用场景,基于DPU芯片开发了面向四个场景的产品线。
一是符合行业标准的高性能网卡,特点是通用性,为国产的高端服务器提供能媲美英伟达和英特尔的同类高性能网卡产品,并针对国产CPU进行深度优化。当前主力产品是FlexFlow 2200T。
二是面向金融行业的超低时延网卡和超低时延计算开发平台,特点是亚微秒级的回环时延,为电子交易场景提供极致的数据链路,产品性能对标证券期货行业内主流使用标杆Solarflare的方案,当前主力产品是Swift 2200N、2502N、NDPP X500、X1100、X3000。
三是面向云原生网络的数据流卸载的网卡,特点是灵活的数据流处理,包括高效的流表卸载、虚拟转发卸载、Hypervisor卸载等灵活的功能,相当于在服务器侧的网卡上“再生”一个辅助专用服务器。当前主力产品是Conflux 2200E、2200P。
四是面向AI集群的后端网络网卡,特点是支持Scale-Out的高性能RDMA网卡和支持Scale-Up的高性能网卡,前者兼容RoCE协议,后者将支持基于各种GPU构造算力的超节点。当前主力产品是FlexFlow 2200R。
据记者了解,以上产品传输数据带宽覆盖25G、40G、100G、200G,同时兼容X86平台和国产主流CPU和操作系统,可广泛适用于云数据中心、智算中心、金融计算、5G边缘计算、高性能计算、高速存储等场景。
鄢贵海提到,目前,中科驭数的部分产品竞争力已经可以与国外产品对标,甚至在一些细分场景上还有优势,但必须承认整体竞争力与国外厂商还有一定差距。从整体市场趋势看,需求侧将会持续强劲,中科驭数有望在这个阶段抓住机会,实现跨越式发展。