在2025世界人工智能大会前夕,7月25日,后摩智能沉淀两年,为AI计算市场带来全新的国产端边AI芯片方案——后摩漫界M50。

漫界M50采用的是产业界最前沿、真正意义上的存内计算架构,芯片大小仅有20×23mm,但在性能上,却可以提供单芯片最高160TOPS的澎湃算力,并配备最大48GB内存和153.6GB/s的超高带宽。
漫界M50目前已经实现了7B/8B大模型25+Tokens/s的推理速度,并且针对DeepSeek已经完成70B参数的模型适配,最大还可支持千亿参数的大模型。
然而在功耗方面,漫界M50又具备极致的高能效比,典型功耗可控制到10W。这为产品在当前蓬勃的端边新兴市场中提供坚实的算力支持,带来无穷想象。
漫界M50背后的缔造者——吴强博士,对业界来说并不陌生,他曾任职于AMD、Facebook等科技公司,并在2020年底创立后摩智能。但吴强及他带领的后摩智能在近两年却十分低调。
漫界M50的诞生也并非坦途。作为一家初创公司,从产品定位到应用场景选择,不得不在外界产业环境的一波又一波潮流中被动做出调整。但好在这次后摩智能抓住了市场窗口,在机器人、智能工业、个人消费终端等新的机遇爆发前,拿到了核心算力底座的入场券。
存算一体技术破局
2020年底,当吴强选择存算一体作为创业方向时,这项技术还鲜有主流芯片公司关注。彼时英伟达GPU已主导AI训练市场,国内初创公司则多扎堆云端GPGPU赛道。5年过后,业内真正推出存内计算芯片产品的公司也只有凤毛麟角。
“选择存算一体出于两个朴素原因。”吴强坦言,“一是要真正解决功耗墙和存储墙问题必须走存算一体路线;二是创业公司与国际巨头竞争,需要创新架构实现弯道超车。”
存算一体技术通过将计算单元嵌入存储器,打破传统芯片中数据在存储与计算单元间频繁搬运的瓶颈。这一架构特别适合大模型这类既需算力密集又需带宽密集的场景。但技术实现难度极高,尤其在量产环节面临电流控制、电源稳定性等工程化挑战。
四年间,后摩团队在国际顶刊发表30余篇论文,其与北京大学合作的DRAM存算论文刚入选计算机体系结构顶会ISCA最佳论文。吴强笑称,对技术的执着就像他几十年坚持运动的自律习惯,一旦认定方向便矢志不渝。
此次发布的M50芯片,背后有着后摩智能这家初创公司向生而行的成功转型故事。
据吴强回忆,2023年下半年,后摩面临艰难抉择:首代大算力芯片瞄准自动驾驶赛道,却遭遇行业价格血战。
“当时业内都在喊千元级智驾芯片,而我们的算力设计太超前,忽略了市场需求,出现算力冗余。”吴强表示,好在2023年恰逢大模型爆发,团队发现存算一体与大模型需求高度契合,毅然决定转向端边大模型芯片。
2024年初,后摩快速推出针对大模型场景调整优化的产品M30,在中国移动巴塞罗那展上成功运行600亿参数模型,给了他们团队极大信心,并坚定转向端边计算芯片方向。
计算方案全面升级收获多家重磅级意向客户
此次发布的M50,则是在前代产品上的全面进化。
M50采用第二代存算IPU设计,自研“天璇”架构,可以创新性实现存内浮点运算,能够很好地针对大模型优化,支持按bit位弹性加速;编译器“后摩大道”可自动优化计算策略。M50还可直接运行FP16浮点模型,大幅降低开发者适配门槛。
“传统GPU需4个相邻的16bit数字,其中2个16bit数字全为零才能稀疏加速,现实很难满足。而存内计算的方案按bit位串行的计算,只要某个bit位全为零就能弹性加速,较传统GPU方案获得更快的计算能力。”吴强现场演示,同样模型下,M50计算速度显著提升,其单颗M50芯片可流畅运行千问14B模型完成公文写作、会议纪要等任务。
除了M50芯片,后摩智能此次还一并发布与芯片相配套的产品矩阵,形成覆盖端侧到边缘的多元算力方案。

其中,力擎LQ50 M.2卡仅有口香糖大小,支持7B/8B模型推理超25tokens/s,为 AI PC、AI Stick、陪伴机器人等移动终端提供端侧AI能力。
力擎LQ50 Duo M.2卡,则集成双M50芯片,具备320TOPS 算力,可实现14B/32B大模型端侧部署;力谋LM5050 加速卡与力谋LM5070 加速卡分别集成2颗、4颗M50芯片,为单机及超大模型推理提供高密度算力,最高算力高达640TOPS;此外,BX50计算盒子则以紧凑机身适配边缘场景,支持32路视频分析与本地大模型运行。
目前联想、讯飞听见、中国移动已成为漫界M50首批意向客户,这意味着未来联想AI PC、讯飞听见智能语音设备、中移5G+AI边缘计算平台都有极大概率集成M50芯片。
极致效率锚定端边计算蓝海
按照吴强勾勒出的后摩智能的市场版图,英伟达、华为等覆盖云边端的巨头,多家国产云端AI芯片阵营专注GPGPU,后摩则锚定端边大模型这片蓝海。
“具身智能是我们当前重点布局的方向之一。”吴强透露,后摩正与机器人合作伙伴测试视觉语言模型(VLA)。
显然吴强始终难忘创业初心——创造出能照顾家人的陪伴机器人。“虽然这个市场尚未成熟,但就像十年前的自动驾驶,一旦爆发将比手机市场更庞大。”
对于端边市场对产业链成本的敏感特性,吴强强调,“后摩不拼价格拼价值”。
“后摩希望用创新技术实现极致效率的芯片,这是公司从创立之初的使命愿景。”吴强表示:“我们希望用领先的存算一体的技术,用领先的芯片,去打造一个‘低功耗、高安全、好体验’的端边智能新生态。希望有一天大模型能够走出云端,真正走入千家百户,真正地赋能千行百业。”

随着M50芯片Q4量产交付,后摩技术能力和蓝海战略将迎来实战检验。吴强透露,公司明年将推出基于DRAM存算的下一代芯片,进一步攻克带宽瓶颈。
在巨头林立的AI芯片战场,后摩智能有望结合正在蓬勃兴起的终端产业,掀起一场效率革命。