上证报中国证券网讯(记者夏子航)近日,行云科技举行首席科学家聘任仪式,公司向南方科技大学研究员、AlayaDB.AI创始人唐博颁发聘书,后者正式就任行云科技首席科学家,全权负责公司AI算力业务技术规划、核心技术落地、算力性能优化及研发团队技术管理工作。
公开资料显示,唐博为香港理工大学博士,长期研究大模型推理系统、人工智能底层系统软件,自2017年起任职南方科技大学计算机系,担任研究员、博士生导师。
产业端,唐博2025年创办AlayaDB.AI,主攻超长上下文大模型推理方案。团队研发的Attention与KV Cache一体化卸载架构,针对性解决大模型推理延迟高、算力损耗大、长文本输出失真等行业共性难题,相关技术可支撑AI Agent大规模商业化落地。
聘任仪式上,行云科技同步对外推出AlayaJet推理引擎。据介绍,以往,企业单独采购GPU硬件部署大模型,硬件资源与模型推理相互割裂,算力利用率偏低,单位Token使用成本居高不下。AlayaJet依靠底层系统优化,无需更新硬件即可压缩推理成本,成为行云科技推进 MaaS业务转型的核心技术底座。
依托该引擎,行云科技推出行云Token云(TaaS)服务,完成业务模式迭代:对外交付产品从GPU算力实例转为标准化模型API,收费模式由按硬件使用时长计费,调整为依据Token数量与业务实际效果结算。公司业务定位也从算力硬件服务商,转向标准化AI智能服务交付平台。
行云科技在AI算力全产业链布局动作频频,业务覆盖硬件配套、算力调度、MaaS平台搭建等,近期陆续拿下数亿元服务器、存储设备采购订单,算力基础设施储备充足。
当前AI算力上游硬件供给逐步充足,硬件采购成本红利持续收窄,行业竞争重心转移至算力调度、推理优化等软件系统能力。对于中游算力运营企业而言,底层系统架构技术,直接决定单位智能产出成本与服务稳定性。行业人士认为,唐博及其技术团队的加入,有助于行云科技形成硬件算力规模、底层推理效率双向协同的发展路径,与仅提供硬件租赁的同行形成差异化竞争优势,同时契合AI基础设施行业从“搭建硬件”到“高效运营算力” 的整体发展趋势。