• 最近访问:
发表于 2026-03-26 00:33:10 股吧网页版
谷歌新算法声称能“6倍压缩KV缓存” 美股存储板块承压走弱
来源:财联社

K图 GOOGL_0

K图 GOOG_0

  周三美股开盘后,在大盘情绪尚可的背景下,存储板块却反向走弱。截至收盘,美光科技跌3.40%、闪迪跌3.50%,西部数据和希捷科技也一同下跌

image

  对于今日的市场异动,有多处信源均将矛头指向了谷歌。AI巨头早些时候推出了一种可能降低人工智能系统内存需求的压缩算法TurboQuant

image

  根据谷歌介绍,TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该算法主要针对AI系统中用于存储高频访问信息的键值缓存(key-value cache)瓶颈问题。随着上下文窗口变大,这些缓存正成为主要的内存瓶颈。

  TurboQuant可在无需重新训练或微调模型的情况下,将键值缓存压缩至3bit精度,同时基本保持模型准确率不受影响。对包括Gemma、Mistral等开源模型的测试显示,该技术可实现约6倍的键值缓存内存压缩效果

image

  此外,在英伟达H100加速器上的测试结果显示,与未量化的键向量相比,该算法最高可实现约8倍性能提升。研究人员也表示,这项技术的应用不局限于AI模型,还包括支撑大规模搜索引擎的向量检索能力。

  谷歌计划于4月的国际学习表征会议(ICLR 2026)上展示TurboQuant技术。

  不难看出,虽然该技术的应用前景目前仍需要打一个问号,但市场已经开始交易内存需求前景转变的预期。

  对于最新变化,富国银行TMT分析师Andrew Rocha解读称:“随着上下文窗口不断扩大,KV缓存中的数据存储规模呈爆炸式增长,从而推高对内存容量的需求。而TurboQuant正是在直接压缩这一成本曲线。如果该技术能够得到广泛采用,这对内存成本曲线而言将是利好。

  Rocha同时表示,这项技术可能影响未来对内存容量规格的需求判断。

  他写道:“如果实现这些AI应用所需的内存规格被显著降低,那么市场很快就会重新评估究竟还需要多少内存容量。”

  不过Rocha也指出,目前仍不清楚该技术是否仅适用于谷歌自身体系,或能否推广至其他AI实验室。此外,实验室环境下的测试结果是否能够顺利转化为真实生产环境中的应用表现,也存在不确定性。

  值得一提的是,作为搅动存储板块的事主,谷歌也没捞着什么好处。公司股价在周三一度跌破290美元,据2月初创下的349美元历史高点已经回撤近17%,距离20%的关键心理位置也只有咫尺之遥。

image

  东财图解·加点干货

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500