• 最近访问:
发表于 2026-04-20 17:39:30 股吧网页版
杭州GPU独角兽曦望获超10亿元融资,推进算力成本降九成
来源:南方都市报

  4月20日,南都N视频了解获悉,国内全栈自研AI推理GPU企业曦望(Sunrise)完成了新一轮超10亿元融资,由多家产业方战投、地方国资及头部财务机构共同参与。这也是2026年AI产业全面迈入“推理落地、智能体普及”时代后,国内GPU赛道诞生的最大单笔融资之一。

  据曦望方面介绍,本轮融资资金将主要用于新一代S3推理GPU的规模化量产交付、全栈软件生态建设,以及S4/S5后续芯片的研发迭代。公开资料介绍,曦望成立于2020年,前身为商汤科技大芯片部门,于2024年底完成分拆。如今,分拆独立仅一年多,其已累计完成七轮融资,总融资额约40亿元,成为国内首家估值超百亿的纯推理GPU独角兽。

  从技术路径来看,据介绍,不同于行业主流的“训推一体”路线,曦望从成立第一天起就坚定All-in推理赛道,以用户真实的Token成本、单位能耗和服务稳定性为芯片设计核心。目前,其已推进三代推理GPU迭代、数万颗GPU量产落地,实现了从芯片研发、产品量产到解决方案交付的完整闭环。

  2026年1月,曦望正式发布新一代旗舰产品启望S3推理GPU,作为国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU,没有盲目照搬高端训练GPU的HBM显存路线,而是基于Agent推理的本质需求,从AI Core计算架构到内存IO系统进行了全链路重构。

  2026年被业内称为“AI智能体元年”。随着大模型从“会聊天”进化为“会思考、会执行”的数字员工,推理需求迎来爆发式增长。英伟达GTC 2026大会正式宣告AI产业全面迈入“推理落地、智能体普及”的新时代,将“每瓦Token吞吐量”定义为AI时代的核心竞争力,这与曦望的核心战场相契合。

  从产业周期看,训练侧格局已相对固化,而推理侧正随Agentic AI放量进入指数级增长通道,多家机构预测,未来五年推理算力市场规模将超越训练侧数倍,其中Agent类负载将贡献最主要的增量。“AI算力基建的重心已彻底切换。”曦望董事长徐冰表示,“2026年AI推理计算需求将达到训练需求的4-5倍,推理算力租赁价格半年涨幅近40%。”

  近期,OpenClaw的爆火也掀起全民“养龙虾”热潮,对此,曦望方面认为,以OpenClaw为代表的智能体推理,“感知—规划—执行—反馈”高频循环,带来了对KV-cache密集访问的全新计算负载,通用GPU面向训练优化,推理实际算力利用率往往远低于峰值——推理侧的效率瓶颈已不再是“算力不够”,而是“算力用不满”。

  据悉,S3通过计算层的深度定制,解决了通用GPU“算力用不满”的核心痛点,推理性能较上一代S2提升5倍,目标实现Token成本下降90%。“S3不是简单的性能升级,而是一次对AI推理成本曲线的重构。”徐冰表示,“我们的目标是将推理成本降至‘百万Token一分钱’,让AI像水电一样成为普惠基础设施。”

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500