• 最近访问:
发表于 2025-11-21 23:08:40 股吧网页版
对标英伟达 华为开源AI容器技术Flex:ai 它可使算力平均利用率提升30%
来源:每日经济新闻

  AI(人工智能)产业高速发展正催生海量算力需求,但全球算力资源利用率偏低的问题日益凸显,“算力资源浪费”成为产业发展的关键桎梏。其具体表现为,小模型任务独占整卡导致资源闲置,大模型任务单机算力不足难以支撑,大量缺乏GPU(图形处理器)/NPU(神经网络处理器)的通用服务器甚至处于算力“休眠”状态,供需错配造成资源浪费。

  11月21日,在2025AI容器应用落地与发展论坛上,华为公司副总裁、数据存储产品线总裁周跃峰发布了AI容器技术——Flex:ai。据悉,Flex:ai通过算力切分技术,将单张GPU/NPU算力卡切分为多份虚拟算力单元,切分粒度精准至10%。此技术实现了单卡同时承载多个AI工作负载,在无法充分利用整卡算力的AI工作负载场景下,算力资源平均利用率可提升30%。

  在面临先进制程受限、单颗AI芯片性能与国外存在差距的现实下,Flex:ai延续了华为“以软件补硬件”的发展路径。

  值得一提的是,华为这项新技术还将对标英伟达2024年底收购的以色列公司Run:ai。Run:ai的核心产品是基于“Kubernetes”(开源容器编排平台)构建的软件平台。其可通过动态调度、池化和分片等手段优化GPU资源使用。例如,自动驾驶公司Wayve就借助Run:ai将GPU集群效率从不足25%提升到80%以上。华为的Flex:ai同样聚焦于通过软件创新实现对英伟达、昇腾等其他第三方算力的统一管理与调度,屏蔽底层硬件差异,为AI应用提供更高效稳定的资源支撑。

  此外,相比Run:ai主要服务于英伟达GPU生态,Flex:ai并没有生态限制,英伟达的GPU和华为昇腾NPU等算力卡都可以使用。

  Flex:ai的能力已在真实产业场景中得到验证。瑞金医院与华为联合打造的多模态病理大模型“RuiPath”,被用于识别病理切片病灶区域,覆盖19个常见癌种。该模型基于103万张病理切片数据训练而成,但仅用16张昇腾910B算力卡便可完成大规模训练。这背后离不开Flex:ai的技术支撑,其通过算力资源切分、智能任务调度等技术,将XPU(CPU、GPU、DPU等芯片的统称)资源可用度从40%提升至70%,破解了有限算力下的大规模训练难题。

  IT研究与咨询公司“Gartner”的分析师表示,目前AI负载大多都已容器化部署和运行。据预测,到2027年,75%以上的AI工作负载将采用容器技术进行部署和运行。

  华为方面称,Flex:ai将在发布后同步开源在魔擎社区中,并与华为此前开源的多款AI工具共同组成完整的ModelEngine(华为推出的AI训推全流程工具链)开源生态。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500