华为,重磅发布!
创始人
2025-11-21 21:27:39
0

11月21日下午,华为在上海举办“2025 AI容器应用落地与发展论坛”,会上正式发布并开源了创新AI容器技术Flex:ai。

据媒体报道,目前,行业内算力资源的平均利用率仅为30%至40%,据华为介绍,Flex:ai通过算力切分技术,将单张GPU(图形处理器)/NPU(神经网络处理器)算力卡切分为多份虚拟算力单元,切分粒度精准至10%。此技术实现了单卡同时承载多个AI工作负载,在无法充分利用整卡算力的AI工作负载场景下,算力资源平均利用率可提升30%。

与英伟达旗下Run:ai只能绑定英伟达算力卡不同,华为AI容器技术Flex:ai通过软件创新,可实现对英伟达、昇腾及其他第三方算力资源的统一管理和高效利用,有效屏蔽不同算力硬件之间的差异,为AI训练推理提供更高效的资源支持。

图片来源:视觉中国-VCG211478193393

为什么推出Flex:ai?华为方面认为,在大模型时代,容器技术与AI是天然搭档。

容器技术作为一种轻量级虚拟化技术,可以将模型代码、运行环境等打包成一个独立且轻量级的镜像,实现跨平台无缝迁移,解决模型部署存在环境配置不一致的痛点。

同时,容器技术可以按需挂载GPU(图形处理器)、NPU(神经网络处理器)的算力资源,并且按需分配和回收资源,提升集群整体的资源利用率。

第三方机构数据显示,目前AI负载大多已容器化部署和运行,预计到2027年,75%以上的AI工作负载将采用容器技术进行部署和运行。

此外,传统容器技术已经无法完全满足AI工作的负载需求,AI时代需要AI容器技术。

Flex:ai可以大幅提升算力资源的利用率,主要是通过对GPUNPU等智能算力资源的精细化管理与智能调度,实现对AI工作负载与算力资源的精准匹配

具体来看,Flex:ai的关键能力分别是算力资源切分、多级智能调度、跨节点算力资源聚合。

以算力资源切分为例,Flex:ai可以单张GPU/NPU算力卡,切分为多份虚拟算力单元,切分粒度精准10%,实现单卡同时承载多个AI工作负载的效果。

每日经济新闻综合上海证券报、公开信

每日经济新闻

相关内容

热门资讯

原创 德... 在不少人眼中,德国的高税收高福利体系是“理想社会”的模板,生病有医保、住房有补贴、失业有兜底,仿佛一...
因买卖合同纠纷,三鑫医疗起诉鄱... 天眼查APP显示,近日,江西三鑫医疗科技股份有限公司新增一则开庭公告,案由为“买卖合同纠纷”,原告为...
2025成都市购房政策汇总! 准备在成都买房的小伙伴注意~ 成都购房政策汇总来啦! 本篇文章内容较长,大家仔细阅读噢 信息索引↓↓...
因买卖合同纠纷,佛山市豪运晟钢... 天眼查APP显示,近日,佛山市豪运晟钢铁贸易有限公司新增一则开庭公告,案由为“买卖合同纠纷”,原告为...
因服务合同纠纷,网宿科技起诉山... 天眼查APP显示,近日,网宿科技股份有限公司新增一则开庭公告,案由为“服务合同纠纷”,原告为网宿科技...
因劳动争议,刘永新起诉维康药业 天眼查APP显示,近日,刘永新新增一则开庭公告,案由为“劳动争议”,原告为刘永新,被告为浙江维康药业...
盗取小轿车后还驾车碰撞警车,上... 今天(21日),上海市公安局普陀分局发布情况通报称,2025年11月21日7时48分,有群众报警称其...
因航空旅客运输合同纠纷,孙博起... 天眼查APP显示,近日,孙博新增一则开庭公告,案由为“航空旅客运输合同纠纷”,原告为孙博,被告为上海...
新兴装备:公司股东此次减持计划... 证券之星消息,新兴装备(002933)11月20日在投资者关系平台上答复投资者关心的问题。 投资者提...
卓胜微卷入专利侵权诉讼,涉案金... 11月21日,卓胜微(300782)发布公告,公司及全资子公司Maxscend Technologi...