• 最近访问:
发表于 2025-12-18 07:35:20 股吧网页版
沐曦股份联合创始人、CTO兼首席硬件架构师彭莉:打造世界一流的GPU芯片及计算平台
来源:上海证券报


K图 688802_0]

  □ 未来,沐曦将以全面开源MXMACA为核心战略,致力于打造中国人工智能领域统一的底层软件生态

  □ 公司产品研发的策略是“在售一代、在研一代、预研一代”,充分布局前沿新兴应用场景,持续夯实企业的长期市场竞争力

  □ 我们的目标是打造世界一流的GPU芯片及计算平台,成为数字经济的算力基石

  AI浪潮席卷全球,算力产业风起云涌。

  12月17日,国产GPU龙头沐曦股份登陆科创板。这一里程碑事件,不仅标志着国产算力生态再次实现突破,更彰显了我国在通用GPU芯片领域历经多年技术攻坚所积累的创新实力。

  自创立之初,沐曦股份便对标国际旗舰芯片产品,瞄准高性能通用GPU计算市场,通过自研核心IP、自主设计GPU架构和指令集,同步开发与硬件相配套的开源软件栈,构建起软硬协同的生态“护城河”。

  如今,沐曦股份进入发展新阶段,将在持续迭代升级软、硬件产品的基础上,进一步深耕核心应用场景,前瞻布局新兴技术领域,打通产业链关键环节,持续拓宽市场边界。

  “我们的目标是打造世界一流的GPU芯片及计算平台,成为数字经济的算力基石。”沐曦股份联合创始人、CTO兼首席硬件架构师彭莉在接受上海证券报记者采访时表示。

  硬件先行:深耕通用GPU

  2020年,人工智能技术迈向了新阶段——从“小模型+判别式”转向“大模型+生成式”,推动应用场景从传统的人脸识别、目标检测、文本分类,向文本生成、文生图、语音生成等升级。

  彼时,沐曦股份刚刚成立,创始团队敏锐地注意到,通用GPU将是支撑未来各类高性能计算场景的“不二之选”。

  “在AI领域,硬件的发展要先于软件。”彭莉告诉记者:“产业处于快速发展阶段,软件算法的更新以月为单位,但硬件的研发周期往往长达两至三年。”

  换言之,算力芯片的开发,就是在以长周期迭代的硬件产品,适配短周期快速升级的产业发展节奏。这意味着,硬件必须在设计之初就具备极强的前瞻性考量与系统性思维。

  而这也是沐曦股份选择通用GPU技术路线的底层逻辑。“无论上层的算法如何变化,通用GPU总是能以其架构优势适配各类软件的计算需求与场景,从而节省大量算子开发时间,降低软件人力投入,并实现硬件资源在多业务场景中的高效复用。”彭莉说。

  不过,相较于DSA(特定架构领域),通用GPU架构虽在泛用性与兼容性上具备显著优势,但开发难度也更高。为此,沐曦股份舍得为研发“下成本”,近三年累计研发投入金额为22.47亿元,占近三年累计营业收入的比例为282.11%。截至2025年3月,公司已取得境内授权专利共计255项,其中境内发明专利245项。

  “沐曦的创始团队深耕通用GPU设计领域超20年,这也是我们的核心优势之一。”彭莉补充道:“通用GPU作为算力的基石,对底层算力的可靠性与AI产业的长期发展具有重要意义,我们坚信通用GPU非做不可。”

  开放兼容:打造开源生态

  开发出通用GPU芯片是否即告成功?答案显然是否定的。海外通用GPU巨头的发展路径已表明,可用的高性能GPU IP虽是实现突破的基石,但生态系统的构建更是厂商的核心竞争力。

  “通用GPU的技术实现具有高度复杂性,其成功不仅依赖于底层高性能芯片的设计,更需要构建一个高度集成化的软件栈体系。”彭莉向记者表示:“软件栈好似一根‘点石成金’的魔法棒,能够掩盖GPU复杂的底层代码,让使用者能够使用计算机高级语言调用GPU的整体算力,使得下层硬件能够较好地支撑上层的算法与数据。”

  事实上,在研发通用GPU芯片之初,沐曦股份同步启动了MXMACA软件栈的开发工作。MXMACA不仅包含完整的自研驱动层、编译器和数学库,还可兼容国际主流的编程语言及编程生态。更重要的是,公司自2025年起开始推进MXMACA走向开源,打造中国版的GPU开放编程接口标准,推动解决跨GPU平台的应用兼容难题。

  “用的人多了才能形成生态。”彭莉表示:“我们将软件栈的核心源代码进行开源,意在让更多开发者在从其他主流生态无缝切换至MXMACA之余,深入理解沐曦GPU软硬件协同完整技术架构带来的便利性,持续扩大MXMACA的影响力。”

  目前,在AI框架、高性能算子库的支持度和模型的适配度方面,MXMACA软件栈已形成深厚的积累,可支持超过6000个国际主流应用,与超过1000个模型实现了原生适配。同时,基于较强的生态兼容性,公司MXMACA软件栈能够开放拥抱全球开发者丰富的开源成果,拥有丰富的人工智能落地场景。

  “未来,沐曦将以全面开源MXMACA为核心战略,致力于打造中国人工智能领域统一的底层软件生态。”彭莉表示。

  “击穿”产业链:推进场景落地

  自GPT-4发布以来,全球人工智能算力建设进入加速通道,下游爆发的算力需求推动全球GPU产品快速上量。Verified Market Research的数据显示,2024年全球GPU市场规模为773.9亿美元,2030年有望达到4724.5亿美元,2024至2030年的复合增长率高达35.19%。

  此时,沐曦股份的硬件与软件建设均趋于完善,亟须将产品优势转化为市场优势。因此,算力解决方案的场景落地成为有待突破的新难点。

  “人工智能的技术价值已获广泛认可,但其长且复杂的产业链中仍存‘瓶颈’。”彭莉向记者解释道:“产业链的每个环节均不乏优秀企业,但各自相对独立,协同有限。比如沐曦虽具备优秀的GPU设计能力,但要实现技术价值向应用场景的有效转化,为市场提供易于落地的算力解决方案,仍需深度结合行业‘Know-How’进行适配。”

  为“击穿”产业链,沐曦股份提出了“1+6+X”方案。其中,“1”代表以国家人工智能公共算力平台、商用AIDC及运营商智算中心构成的数字算力底座,即公司发展的基本盘;“6”则聚焦AI赋能的六大关键行业——金融、医疗健康、能源、教科研、交通、大文娱,这些垂直领域将成为未来GPU市场增长的核心驱动力;“X”代表面向未来的产业,包括具身智能、低空经济、量子计算及其他“AI for Science(人工智能驱动的科学研究)”应用。

  “我们希望沿着产业链寻找上下游合作伙伴,在积累行业‘Know-How’的同时,面向上述行业打造典型落地案例,有效开拓市场。”彭莉表示。

  值得注意的是,沐曦股份本次IPO拟募资39.04亿元,除用于开发新一代训推及推理通用GPU外,还将围绕前沿芯片技术研发和前沿GPU系统研发两大方向开展研发工作。其中,前沿芯片技术研发包括超高带宽显存、先进工艺芯粒(Chiplet)架构、设计工艺联合优化(DTCO)、GPU光互连技术等;前沿GPU系统研发具体包括大功率POL(负载点)电源设计与优化、GPU系统散热技术研究、Scale-up(纵向扩展)互连方式优化改进、超节点服务器系统交换架构的演进与优化等。

  “公司产品研发的策略是‘在售一代、在研一代、预研一代’,充分布局前沿新兴应用场景,持续夯实企业的长期市场竞争力。”彭莉表示。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500