即将登陆科创板的摩尔线程,再传大利好。
11月28日,摩尔线程在官方微信公众号披露,公司近日正式发布PyTorch深度学习框架的MUSA扩展库——Torch-MUSA v2.7.0,新版本在功能集成、性能优化与硬件支持方面实现进一步突破。

摩尔线程表示,Torch-MUSA在短短一个月内,连续完成v2.5.0和v2.7.0两次版本更新,充分体现了公司在MUSA生态建设上的持续投入与快速迭代能力。
新版本算子总数超过1050个
v2.7.0版本新增特性包括动态双精度转换(Dynamic Double Cast)、分布式检查点(Distributed Checkpoint),并实现多项功能增强。
目前,Torch-MUSA专属支持的算子总数已超过1050个,系统在性能与稳定性方面均实现进一步提升,为大模型训练与推理提供了更高效、更可靠的底层支持。

根据招股书,MUSA架构是摩尔线程自主研发的融合GPU硬件和软件的全功能GPU计算加速统一系统架构。
摩尔线程表示,自v2.5.0起,Torch-MUSA版本号已与PyTorch主版本号保持同步,便于开发者进行版本识别与管理。新版本进一步集成muSolver与muFFT等计算加速库,显著提升复杂计算任务的执行效率;同时新增对统一内存设备(Unified Memory)的UMM支持,有效优化内存使用效率。
摩尔线程还透露,Torch-MUSA将继续跟进PyTorch的版本更新,计划下一版本支持PyTorch 2.9.0,并进一步优化性能与功能,持续构建和完善基于MUSA架构国产全功能GPU的深度学习生态。
更多算子支撑更丰富生态
招股书显示,基于MUSA架构,摩尔线程率先实现了单芯片架构同时支持AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码的技术突破,有力推动了我国GPU产业的自主可控进程。

摩尔线程的MUSA架构重要性如何?更多的算子又意味着什么?
有接近摩尔线程人士介绍,摩尔线程的MUSA是其GPU架构、软件、生态的总称,具备替代由英伟达及其CUDA主导的国际主流GPU生态的能力。MUSA SDK、Torch-MUSA等是开放给开发者使用MUSA GPU的软件栈。摩尔线程从0构建了底层硬件架构、指令集、编译器、驱动等组件,提供算子加速库、通信库、监控管理工具等,并向上对接人工智能框架及应用生态。
MUSA软件栈能够释放全功能GPU在AI计算、科学计算、图形渲染和多媒体等场景的极致性能,原生支持FP8混合精度计算,显著提升大模型训练和推理效率,同时支持FP64的高精度科学仿真计算等。
记者了解到,GPU芯片的算子库是封装了矩阵乘等张量计算,卷积、池化、线性代数求解器等各类运算操作的集合,是连接GPU硬件与上层AI应用、深度学习框架、科学计算与仿真的关键纽带。在GPU芯片架构的基础上,越丰富的算子库,越有助于充分释放GPU算力提升计算效率、降低开发者应用门槛、提升生态兼容性和支撑更丰富的应用场景。
持续加快业务拓展
作为科创板对高科技未盈利企业发展大力支持的典型,“国产GPU第一股”摩尔线程从IPO受理到过会,仅用时88天。
摩尔线程的IPO发行价格为114.28元/股,预计募集资金总额为80亿元,扣除发行费用后,预计募集资金净额为75.76亿元。
紧锣密鼓推进上市的同时,摩尔线程也在快马加鞭推进业务发展。
比如,国家信息中心在官方微信宣布,10月21日上午,国家信息中心与摩尔线程智能科技(北京)股份有限公司(简称“摩尔线程”)在北京举行战略合作协议签约仪式。国家信息中心主任徐强、摩尔线程首席执行官兼创始人张建中出席签约仪式。国家信息中心副主任周民与摩尔线程首席运营官周苑代表双方签署战略合作协议。

根据协议,双方将依托各自资源及优势,积极落实国家关于新型基础设施建设的重大部署,在算力领域前瞻性研究、算力产业生态培育、算力网共性技术研发等方面开展全方位合作,共同推进全国一体化算力网体系建设,助力数字经济高质量发展。
