“现阶段,锁产能比谈价格更重要。”
作者:牛思若
谷歌一条关于“内存占用减少至原来的1/6”的技术消息,把全球存储板块砸出了一身“冷汗”。
近期,谷歌推出TurboQuant压缩算法,在不牺牲模型精准度的前提下,将AI推理阶段最耗资源的“键值缓存”(KV Cache)空间需求减少至原来的1/6,并让注意力计算速度提升8倍。
消息一出,市场很快将其解读为“会冲击人工智能对存储芯片的整体需求”,并迅速传导至资本市场,存储芯片概念股集体走弱。
与此同时,“内存条价格断崖式下跌”的话题冲上热搜。渠道价格松动、技术扰动与板块回调交织在一起,让市场不禁重新开始追问:这一轮存储行情,是否已经走到了拐点?
来自渠道端的局部“松动”
这轮被广泛讨论的内存条价格下跌,更多发生在现货渠道,主要面向有自主装机需求的个人玩家。
这样的市场本身体量有限,对价格波动和消费情绪更加敏感。渠道商既要看上游报价,也得顾及C端用户到底买不买账。
华强北一位专卖内存条的商铺老板告诉记者,从上周三开始,多款内存产品就出现了降价,目前16G内存价格从上周的900元左右下降到目前的700元左右,32G内存价格也基本下降了300元左右。
价格跳水和股价暴跌,确实会造成一种“行情见顶”的错觉。在业内人士看来,这更像是渠道市场对前期涨幅过快的一次短暂修正,而不是产业趋势的反转。
“由于前期价格涨幅过大,渠道客户对于高价存储产品的抵触心理日渐强烈,市场实际成交艰难。更重要的是,现货贸易端欲回笼资金、获利变现,贸易端低端DDR4内存条抛售较多,进一步冲击和打压了渠道市场。”一位市场分析人士表示。
而从合约市场看则是另外一番景象。据该人士透露,今年一季度原厂服务器及PC NAND、DRAM合约价均呈翻倍式增长。

该人士表示,目前存储产品没法完全满足市场的需求,存储供应短缺的问题,短期内很难缓解,所以渠道市场的价格回调并不会改写整个存储行业上行逻辑。
“没有内存就没有AI”
几乎同一时间,在深圳举办的中国闪存市场峰会MemoryS 2026现场,空气里弥漫的却是另一种情绪。
“每个人都在问我有没有货,甚至只要货,不问价。”有存储展商的销售人员向记者苦笑道,“但我们现在也只能满足三四成需求,碰到量太大的单子,只能推掉。”

市场在担心需求降温,但产业峰会现场感受到的,却依旧是供给紧绷。人满为患的会场里,“存储行业缺货还要缺多久”成了最热的话题之一。
闪存市场总经理邰炜表示:“AI不仅仅是风口,更是一场底层革命,它正在把存储从一个BOM表里的成本项变成AI竞赛的战略资源,从一个周期性的产品变成数字经济的核心竞争力。”
这并不是夸张。
不管是大模型的训练、推理、微调,还是多模态应用,每一个环节都把存储的带宽和容量拉到了极致。HBM也从一个小众的高端产品,一举变成AI时代的“石油”;大容量的DDR5内存,也从可选配置变成了AI服务器的标准配置;企业级SSD也不只是容量的载体,而是整个算力架构里突破性能瓶颈的关键。
邰炜解释称,大模型在推理时,需要把每一层、每个Token的Key Value结果存起来,以避免重复计算,缩短响应时间。当上下文从4K Token拉长到128K Token,KV缓存空间需求会成倍放大;再叠加高并发请求,需求量级会迅速抬升,单靠HBM已难以承接,越来越多压力开始向NVMe SSD转移。
“也正因如此,针对AI推理负载优化的SSD需求增长极快,eSSD成为2026年NAND最大的应用市场。”邰炜判断。
“没有内存就没有AI。”群联电子CEO潘健成的判断更加直接。在他看来,谷歌推出的压缩算法,并不意味着存储需求会线性坍缩,相反,压缩技术意味着主机成本下降、出货数量上升,也意味着用户可以产出更多Token,带来更多存储和调用需求。
摩根士丹利也认为,通过大幅降低单次查询的服务成本,TurboQuant能够让原本只能在云端昂贵集群上运行的模型迁移至本地,有效降低AI规模化部署的门槛,这可能反而进一步提振整体需求。
扩产要等,缺货难解
“虽然现在存储原厂已经开始增加新的资本开支、扩产能,但存储行业的产能扩张周期长达18到24个月,最早也要到2027 年才会有新产能释放。”邰炜告诉记者,存储供应短缺的问题,短期内很难缓解。
在他看来,2026 年全球没有任何一款主流的AI存储产品能实现供需完全平衡,存储行业的焦点已经从“看谁更便宜”转向“看谁能拿到货”。
“现阶段,锁产能比谈价格更重要。”邰炜直言。
存储主控龙头慧荣科技高管也表示,2026年还不算至暗时刻,2027年供需缺口会放大,因为本轮涨价缺货并非简单的周期性波动,而是由AI带动的结构性变革,毕竟AI训练、推理产生的海量数据对存储需求是前所未有的。
一边承压,一边上探
于是,一个更现实的分化开始出现。
对手机、PC等传统消费市场而言,存储涨价首先体现为成本压力。一些存储厂商开始走“性价比”路线,试图用更少的运存做出更高的等效体验。

例如,江波龙正试图通过HLC高级缓存技术与SPU、UFS的深度集成,推动AI PC端和嵌入式端全场景落地,在优化AI体验的同时,降低终端对DRAM容量的需求和成本;群联电子推出Phison Hybrid AI SSD与aiDAPTIV+技术,预计可减少超50%的DRAM使用量,实现成本可控且安全的本地推理。
而另一边,大家又在集体“向上走”——资源和产能正优先流向高技术、高价值、高壁垒产品。
过去,AI 产业的聚光灯打在“训练”上,算力集群的吞吐固然惊人,但需求往往是阶段性的。如今,行业的重心正全面转向“推理”,这是一个更高频、更细密、更贴近真实商业流的“无底洞”。
根据国家数据局的最新数据,今年3月份,中国日均Token调用量突破了140万亿,近2年增长超千倍。在黄仁勋看来,智能体式AI有望将Token的消耗量提升1000倍,从而形成他所称的“算力真空”。
邰炜直言:“我们可以确认一句话——谁能解决‘AI时代数据搬运的功耗和延迟’,谁就能定义下一个10年。存储将进入AI驱动的超级周期。”
三星电子执行副总裁兼方案平台开发团队负责人张实完表示,高性能存储已不再是可有可无的选项,而是决定系统决策效率与规模的核心基石。围绕这一判断,三星正在推进PCIe Gen6固态硬盘PM1763,并计划于2026年至2027年推出更高密度的EDSFF驱动器,以提升单机架容量与带宽。
长江存储固态硬盘事业部负责人谭弘提到,AI竞赛已从重在“厚积”的训练阶段,进入重在“薄发”的推理阶段,存储带宽瓶颈正严重制约算力释放,目前GPU集群可用度仅约50%。
在他看来,破局之道在于存算协同:训练侧可依托大容量QLC eSSD存储Checkpoint,提升GPU效率;推理侧则通过eSSD分层缓存KV Cache,承接上下文状态管理。针对此类场景,长江存储推出多款Gen5企业级eSSD新品。
对于存储厂商而言,真正的考题不是能不能涨价,而是能不能站到更高价值的那一层。
从价格战到价值战,从单品到全栈方案,从算力附庸到“AI胜负手”……在这场由AI重写规则的竞赛里,零售价偶尔松动,不过是水面泛起的波纹;而在更深处,筹码依然稀缺,且无比昂贵。