• 最近访问:
发表于 2025-07-27 15:43:40 股吧网页版
10W功耗掀起160TOPS算力!后摩智能发布首款存算一体芯片漫界M50 端边AI计算迎来破局者
来源:科创板日报

  在2025世界人工智能大会前夕,7月25日,后摩智能沉淀两年,为AI计算市场带来全新的国产端边AI芯片方案——后摩漫界M50。

image

  漫界M50采用的是产业界最前沿、真正意义上的存内计算架构,芯片大小仅有20×23mm,但在性能上,却可以提供单芯片最高160TOPS的澎湃算力,并配备最大48GB内存和153.6GB/s的超高带宽。

  漫界M50目前已经实现了7B/8B大模型25+Tokens/s的推理速度,并且针对DeepSeek已经完成70B参数的模型适配,最大还可支持千亿参数的大模型。

  然而在功耗方面,漫界M50又具备极致的高能效比,典型功耗可控制到10W。这为产品在当前蓬勃的端边新兴市场中提供坚实的算力支持,带来无穷想象。

  漫界M50背后的缔造者——吴强博士,对业界来说并不陌生,他曾任职于AMD、Facebook等科技公司,并在2020年底创立后摩智能。但吴强及他带领的后摩智能在近两年却十分低调。

  漫界M50的诞生也并非坦途。作为一家初创公司,从产品定位到应用场景选择,不得不在外界产业环境的一波又一波潮流中被动做出调整。但好在这次后摩智能抓住了市场窗口,在机器人、智能工业、个人消费终端等新的机遇爆发前,拿到了核心算力底座的入场券。

  存算一体技术破局

  2020年底,当吴强选择存算一体作为创业方向时,这项技术还鲜有主流芯片公司关注。彼时英伟达GPU已主导AI训练市场,国内初创公司则多扎堆云端GPGPU赛道。5年过后,业内真正推出存内计算芯片产品的公司也只有凤毛麟角。

  “选择存算一体出于两个朴素原因。”吴强坦言,“一是要真正解决功耗墙和存储墙问题必须走存算一体路线;二是创业公司与国际巨头竞争,需要创新架构实现弯道超车。”

  存算一体技术通过将计算单元嵌入存储器,打破传统芯片中数据在存储与计算单元间频繁搬运的瓶颈。这一架构特别适合大模型这类既需算力密集又需带宽密集的场景。但技术实现难度极高,尤其在量产环节面临电流控制、电源稳定性等工程化挑战。

  四年间,后摩团队在国际顶刊发表30余篇论文,其与北京大学合作的DRAM存算论文刚入选计算机体系结构顶会ISCA最佳论文。吴强笑称,对技术的执着就像他几十年坚持运动的自律习惯,一旦认定方向便矢志不渝。

  此次发布的M50芯片,背后有着后摩智能这家初创公司向生而行的成功转型故事。

  据吴强回忆,2023年下半年,后摩面临艰难抉择:首代大算力芯片瞄准自动驾驶赛道,却遭遇行业价格血战。

  “当时业内都在喊千元级智驾芯片,而我们的算力设计太超前,忽略了市场需求,出现算力冗余。”吴强表示,好在2023年恰逢大模型爆发,团队发现存算一体与大模型需求高度契合,毅然决定转向端边大模型芯片。

  2024年初,后摩快速推出针对大模型场景调整优化的产品M30,在中国移动巴塞罗那展上成功运行600亿参数模型,给了他们团队极大信心,并坚定转向端边计算芯片方向。

  计算方案全面升级收获多家重磅级意向客户

  此次发布的M50,则是在前代产品上的全面进化。

  M50采用第二代存算IPU设计,自研“天璇”架构,可以创新性实现存内浮点运算,能够很好地针对大模型优化,支持按bit位弹性加速;编译器“后摩大道”可自动优化计算策略。M50还可直接运行FP16浮点模型,大幅降低开发者适配门槛。

  “传统GPU需4个相邻的16bit数字,其中2个16bit数字全为零才能稀疏加速,现实很难满足。而存内计算的方案按bit位串行的计算,只要某个bit位全为零就能弹性加速,较传统GPU方案获得更快的计算能力。”吴强现场演示,同样模型下,M50计算速度显著提升,其单颗M50芯片可流畅运行千问14B模型完成公文写作、会议纪要等任务。

  除了M50芯片,后摩智能此次还一并发布与芯片相配套的产品矩阵,形成覆盖端侧到边缘的多元算力方案。

image

  其中,力擎LQ50 M.2卡仅有口香糖大小,支持7B/8B模型推理超25tokens/s,为 AI PC、AI Stick、陪伴机器人等移动终端提供端侧AI能力。

  力擎LQ50 Duo M.2卡,则集成双M50芯片,具备320TOPS 算力,可实现14B/32B大模型端侧部署;力谋LM5050 加速卡与力谋LM5070 加速卡分别集成2颗、4颗M50芯片,为单机及超大模型推理提供高密度算力,最高算力高达640TOPS;此外,BX50计算盒子则以紧凑机身适配边缘场景,支持32路视频分析与本地大模型运行。

  目前联想、讯飞听见、中国移动已成为漫界M50首批意向客户,这意味着未来联想AI PC、讯飞听见智能语音设备、中移5G+AI边缘计算平台都有极大概率集成M50芯片。

  极致效率锚定端边计算蓝海

  按照吴强勾勒出的后摩智能的市场版图,英伟达、华为等覆盖云边端的巨头,多家国产云端AI芯片阵营专注GPGPU,后摩则锚定端边大模型这片蓝海。

  “具身智能是我们当前重点布局的方向之一。”吴强透露,后摩正与机器人合作伙伴测试视觉语言模型(VLA)。

  显然吴强始终难忘创业初心——创造出能照顾家人的陪伴机器人。“虽然这个市场尚未成熟,但就像十年前的自动驾驶,一旦爆发将比手机市场更庞大。”

  对于端边市场对产业链成本的敏感特性,吴强强调,“后摩不拼价格拼价值”。

  “后摩希望用创新技术实现极致效率的芯片,这是公司从创立之初的使命愿景。”吴强表示:“我们希望用领先的存算一体的技术,用领先的芯片,去打造一个‘低功耗、高安全、好体验’的端边智能新生态。希望有一天大模型能够走出云端,真正走入千家百户,真正地赋能千行百业。”

image

  随着M50芯片Q4量产交付,后摩技术能力和蓝海战略将迎来实战检验。吴强透露,公司明年将推出基于DRAM存算的下一代芯片,进一步攻克带宽瓶颈。

  在巨头林立的AI芯片战场,后摩智能有望结合正在蓬勃兴起的终端产业,掀起一场效率革命。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500