上周,特斯拉透露,正在内部评估整合数千片AI5芯片,以供下一代人工智能模型的训练。特斯拉CEO马斯克称,紧随其后的AI6芯片,有望成为迄今为止最出色的AI芯片。据称,AI5芯片被认为是对于参数数量低于2500亿的模型来说,最好的推理芯片。
早在2017年,特斯拉就开始了自研芯片之路。只不过那时还只是研发自动驾驶芯片,并为此挖来了AMD前首席芯片架构师吉姆·凯勒。这位芯片业的传奇人物,先后参与并缔造了AMD的X86-64架构、K8架构以及苹果的A4、A5处理器。
如果说自研自动驾驶芯片是为了平衡功耗和成本,那么AI5和AI6芯片,则是特斯拉趁势出击,向更广阔的人工智能领域拓展。毕竟,自动驾驶只是特斯拉业务的很小一部分,它的理想还有进军太空,以及人形机器人等更长更广的产业链。这些产业链与人工智能算力密不可分。
特斯拉并不是IT大佬自研芯片的个案。此前,与生产芯片也没什么关联的谷歌,已经打造出了自己的TPU(张量处理单元)芯片。
TPU是谷歌专为加速机器学习和深度学习任务设计的专用集成电路芯片,该芯片最初于2016年举行的谷歌开发者大会上宣布推出,旨在优化TensorFlow框架下的张量运算效率。TPU采用定制化架构设计,在矩阵计算任务中展现出比传统GPU和CPU高15倍至30倍的推理速度,且能效比提升30倍到80倍。截至2024年,谷歌已迭代至第六代TPU。
无论谷歌自己是否承认自研TPU是为了减少对英伟达的依赖,还是为了降低芯片采购成本,但TPU出来以后,确实能抢英伟达GPU的市场份额。
日前,OpenAI宣布,首次采用谷歌TPU芯片为其ChatGPT及其他产品提供算力支持,而在此之前,OpenAI一直是英伟达图形处理器最大的采购商之一。当然,这也为英伟达市值冲上全球第一作出了不小的贡献。
而现在,英伟达面对的还不仅仅是谷歌和特斯拉这些体量不小的巨头,Meta、苹果、亚马逊、高通、AMD等都希望和它分享市场。
比如,OpenAI不仅要用谷歌的TPU,还计划和博通一起自己造AI芯片。其理由很简单,就是在降低对英伟达依赖的同时,在AI软硬件上均衡发力。
无论是OpenAI还是博通,名气都可以在AI领域横着走,为什么一定要让英伟达在AI芯片市场独占八成的市场份额?
可以说,AI芯片以及软硬件产业链已经进入了“战国时代”,像Meta、亚马逊这些财大气粗的IT巨头,都在发力自研AI芯片。
Meta已经开始跟联发科合作研发自己的AI芯片,代号叫“Arke”。该芯片采用2nm制程工艺,计划于2027年上半年量产。亚马逊在CPU中央处理器上早已“遥遥领先”。
目前,亚马逊全球新增算力的一半以上,都是基于Arm架构的Graviton系列自研芯片,并自研了Trainium系列AI芯片。其中,Trainium2芯片已经被亚马逊投资的AI创业公司Anthropic用于训练大模型,Trainium3则将于2025年末量产。
为了降低成本掌控全产业链,各大IT巨头都摩拳擦掌。这对于国内人工智能产业的发展,也是有所启迪的。这其实也是阿里等一众人工智能产业链的重要参与者要自研AI芯片的原因。在上一代互联网时代,我们不仅没有掉队,而且处于领先的位置;在下一代人工智能时代,我们更不能屈居人后。