新华财经上海6月16日电(记者杜康)记者获悉,硅基流动近日完成超20亿元B轮融资。随着大模型应用加速落地,面向企业级客户的低成本、高稳定性Token供应能力,正成为AI基础设施竞争的重要环节。
此轮融资由携程战投、晶科能源控股、金蝶股份、联通新沃、盛奕资本(润泽集团产业资本)、壁仞战投、蔚来资本、商汤战投、巨人网络、国泰君安创新投、纪源资本等产业资本、财务投资机构和国资共同参与,华兴资本担任独家财务顾问。
随着大模型应用加速落地,Token(即“词元”)调用量正成为观察AI基础设施需求的重要指标。IDC预测,2026年中国市场Token消耗量将达到40000万亿,较2025年增长约20倍。
面对海量的市场需求爆发,大规模、高性价比Token的稳定供应,正成为影响AI技术规模化落地的关键能力。然而,算力的结构性紧缺、碎片化以及利用率低下,导致优质Token供给严重不足。高企的Token成本成为制约企业规模化落地的核心痛点。
硅基流动主要面向企业级客户提供MaaS(模型即服务)和推理基础设施服务。公司方面介绍,过去一年,公司通过“Token工厂”模式提升大模型推理服务效率,日均Token调用量达数万亿,服务超过1000万用户和1万家企业客户,营收同比增长超过10倍,海外市场单月营收达数百万美元。
据介绍,硅基流动客户覆盖能源、金融、交通等行业央企,公共事业机构、国家级科研院所、电信运营商、地方智算中心,以及云服务企业、大模型企业和AI应用开发工具厂商等。公司方面表示,本轮融资后,公司将进一步加强推理引擎、异构算力调度、国产芯片适配和企业级MaaS服务能力建设。
在技术层面,硅基流动以自研推理引擎和异构算力纳管调度系统为核心,支持DeepSeek、Qwen、GLM、Kimi等主流模型,并适配英伟达、昇腾、沐曦、摩尔线程等多元芯片。公司称,其平台已适配超过160款模型,覆盖文本、图像、语音等多模态任务,可将不同类型算力资源转化为标准化模型服务能力。
当前,大模型推理服务正面临算力结构性紧缺、异构芯片适配复杂、资源利用率不高、Token成本较高等问题。硅基流动表示,公司通过推理引擎优化、KV缓存管理、专家并行、流水并行、跨地域资源调度等技术手段,提升异构算力集群利用效率,以满足企业级客户多模型、多场景、高并发的调用需求。
Gartner最新发布的全球AI云市场指南显示,硅基流动是入选代表性厂商之一。海外大模型路由平台OpenRouter数据显示,在70余家Token供应商中,硅基流动日Token消耗量曾连续数周位居第一。