刘柯
AI领域的焦点,正从英伟达转向谷歌。就在资本市场对英伟达的财报和高估值争论不休的时候,“谷歌链”开始浮出水面,这也让唱空和做空英伟达的一方有了强有力的武器。
整个世界都在想逃离“英伟达税”,因此这个时候“谷歌链”悄悄崛起颇有意思。大家对谷歌其实并不陌生,但对“谷歌链”以及其对AI领域产生的影响,似乎在重新认识。“谷歌链”的优势在于全产业链闭环,它可以实现全栈式技术方案以及强大的生态,覆盖芯片、云、大模型、应用四大环节,是垂直整合程度最高的AI大厂。这也是英伟达梦寐以求并正在付诸实施的愿景,英伟达之所以要入股OpenAI,之所以要收购云服务初创公司Lepton AI,就是为了打造AI产业链闭环。
最关键的,是谷歌3亿的付费订阅用户,是6.5亿AI模型Gemini的月活跃用户。这是英伟达可望而不可及的,因为应用端的渠道基本都已经排排坐,没有多大的缝隙可以给新来者。但这却并不是市场担忧的焦点,“谷歌链”的真正挑战并不是用户应用端,因为庞大的终端用户已经不是秘密。那英伟达担心什么?担心的是谷歌利用终端优势向上拓展的AI硬件,即专用集成电路芯片TPU对图形加速芯片GPU的挑战,即全光交换网络OCS对英伟达CUDA并行计算平台的挑战。
TPU也叫张量处理单元,2016年5月在Google I/O开发者大会上首次公开并应用于AlphaGo人工智能围棋系统。TPU是专为神经网络的矩阵运算优化而设计的芯片,优势很明显,其开发成本更低、满负荷运行时功耗更小,在特定场景下具有成本和能效优势,比如高频交易公司,大型金融机构等,来满足数据安全和合规要求。但TPU的短板也很突出,它只专注于高效计算AI 神经网络中的矩阵运算,灵活性不如英伟达GPU,其采用脉动阵列架构和低精度计算技术,在矩阵运算任务中展现出比传统GPU和CPU高15至30倍的推理速度,能效比提升30至80倍。目前谷歌已经发布了第七代TPU芯片,其FP8峰值算力4614 TFlops(每秒4.6万亿亿次运算),首次超越英伟达B200的4500 TFlops,且能效比提升29倍。
与TPU芯片配套的,是谷歌的光电路交换平台OCS,它是一种通过物理层面改变光束路径实现数据传输的技术,具有超低延迟、高能效和高带宽等优势,主要应用于AI算力、数据中心等场景。这其实也是英伟达最担忧的,因为仅仅从芯片竞争看它不是很担心,毕竟英特尔、AMD的芯片对其GPU的冲击会更大,但谷歌将TPU和OCS结合,则会对其CUDA(通用并行计算平台和编程模型)形成直接竞争。CUDA包含指令集架构和GPU并行计算引擎,支持多种语言编程,开发者可实现CPU与GPU协同计算,其与GPU的配合是英伟达独步AI硬件产业链的关键所在。
也许有人会纳闷,其实谷歌的这些东西也算不上突然蹦出来的,为什么现在成了英伟达的威胁?原因也很简单,以前谷歌的TPU+OCS都是自己用,即在自己的云计算中心使用,但现在要拓展到直接把硬件套装卖给客户了,Meta就正在与谷歌就2027年在其数据中心使用价值数十亿美元的TPU芯片进行谈判,同时计划明年从谷歌云租用芯片。大家想一下,以前云巨头们都在采购英伟达的GPU,高达75%的毛利被英伟达拿走了,云厂商的AI业务毛利从传统的50%到70%骤降至20%到35%,如果换成“谷歌链”就能使毛利率回升,谁不愿干?现在是Meta,后面会不会是微软或者亚马逊?
于是,市场开始重新给AI产业链估值。首先从芯片开始。TPU芯片是ASIC(特定用途定制设计的集成电路)芯片的一个分支,是目前在AI领域能与GPU(以前也只做图形加速)抗衡的专用芯片。2024年全球GPU、ASIC芯片出货量分别为876万、283万颗,预计2030年这一数字将增长至约3000万、1400万颗,对应2024年到2030年的年均复合增速约为23%和30%。由此可见,ASIC芯片的成长空间更大,特别是在芯片的制程物理大小被摩尔定律限制以后,GPU似乎更容易达到天花板,而ASIC芯片的发展前途更光明。连AIGC的鼻祖OpenAI都开始计划2026年底实现3纳米ASIC芯片的量产,由此可见一斑。
当然,把芯片组合在一起运算无损算力才是根本,这也是OCS与CUDA网络架构的核心竞争,OCS技术正在被市场重新认识。传统电交换机需要进行光、电、光转换,导致微秒级的延迟和较高的能耗,转发延迟差不多十亿分之一秒,而OCS的切换延迟却可以达到千分之一秒,两者相差百万倍。OCS不同于传统交换机,可直接进行光路交换,无需做光电转换,通过全光路切换实现数据传输。谷歌实测表明,OCS网络延迟降低50%以上,能耗比电交换机低50倍。你可以这样理解,OCS架构的算力损耗更小且性价比更高,更适合训练;CUDA架构的适用性和拓展性更强,更适合应用拓展,核心在于你用这个智算中心干什么。
而谷歌能把这个系统玩这么转,关键还在于其庞大的下游用户,也就是训练出来的算力有庞大的吸纳潜力。因此,“谷歌链”有可能凭借TPU+OCS闯出一条不同于“英伟达链”的新路。而一旦这条路成功了,就可能不断蚕食英伟达目前高达85%左右的市场份额,从10%到20%甚至更多,这就是资本市场开始追捧“谷歌链”的根本所在。