解决算力效率难题!华为发布AI新技术
创始人
2025-11-22 18:45:46
0

(来源:中国金融信息中心)

CFIC导读

华为的创新AI容器技术Flex:ai技术实现了单卡同时承载多个AI工作负载,在无法充分利用整卡算力的AI工作负载场景下,算力资源平均利用率可提升30%。

原标题:华为AI突破性技术揭晓!

11月21日下午,华为在上海举办“2025 AI容器应用落地与发展论坛”,会上正式发布并开源了创新AI容器技术Flex:ai。

目前,行业内算力资源的平均利用率仅为30%至40%,据华为介绍,Flex:ai通过算力切分技术,将单张GPU(图形处理器)/NPU(神经网络处理器)算力卡切分为多份虚拟算力单元,切分粒度精准至10%。此技术实现了单卡同时承载多个AI工作负载,在无法充分利用整卡算力的AI工作负载场景下,算力资源平均利用率可提升30%。

与英伟达旗下Run:ai只能绑定英伟达算力卡不同,华为AI容器技术Flex:ai通过软件创新,可实现对英伟达、昇腾及其他第三方算力资源的统一管理和高效利用,有效屏蔽不同算力硬件之间的差异,为AI训练推理提供更高效的资源支持。

大幅提升算力资源利用率

据介绍,华为Flex:ai是基于Kubernetes容器编排平台构建的XPU池化与调度软件,通过对GPU、NPU等智能算力资源的精细化管理与智能调度,实现AI工作负载与算力资源的“精准匹配”,大幅提升算力资源利用率。

据了解,容器技术作为一种轻量级虚拟化技术,可以将模型代码、运行环境等打包成一个独立的、轻量级的镜像,实现跨平台无缝迁移,解决模型部署“环境配置不一致”的痛点。容器还可以按需挂载GPU、NPU算力资源,按需分配和回收“资源”,提升集群整体资源利用率。

AI时代需要AI容器

根据Gartner的报告,目前AI负载大多都已容器化部署和运行,据预测,到2027年,75%以上的AI工作负载将采用容器技术进行部署和运行。

谈及为什么推出Flex:ai AI容器技术,华为公司副总裁、数据存储产品线总裁周跃峰表示,传统容器技术已无法完全满足AI工作负载需求,AI时代需要AI容器。

具体而言,周跃峰表示,首先,大型语言模型(LLM)的容器镜像轻松突破10GB,多模态模型镜像甚至可达TB级别,传统容器无法支持超大镜像的快速拉起,环境构建时间往往长达数小时。

其次,传统容器主要针对CPU(中央处理器)、内存等通用计算资源进行管理与调度,而AI大模型训练与推理还需大幅依赖GPU、NPU等智能算力资源,传统容器无法对异构智算资源做到算力细粒度切分与智能调度,导致即使很小的AI工作负载也独占整张算力卡,且无法进行远程调用。

最后,传统容器的资源调度以固定分配、通用调度为主,而AI工作负载的资源调度需要以保障任务完成效率为目标,对不同任务的特性进行感知,实现动态弹性的资源分配。

据介绍,与英伟达今年年初收购的Run:ai公司的核心产品相比,华为Flex:ai在虚拟化、智能调度等方面具备独特优势。

具体来看,在本地虚拟化技术中,Flex:ai支持把单个物理GPU/NPU算力卡切割为数个虚拟算力单元,并通过弹性灵活的资源隔离技术,可实现算力单元的按需切分。

同时,Flex:ai独有的“拉远虚拟化”技术,可以在不做复杂的分布式任务设置情况下,将集群内各节点的空闲XPU算力聚合形成“共享算力池”,此时不具备智能计算能力的通用服务器通过高速网络,可将AI工作负载转发到远端“资源池”中的GPU/NPU算力卡中执行,实现通用算力与智能算力资源融合。

在智能调度方面,Flex:ai的智能资源和任务调度技术,可自动感知集群负载与资源状态,结合AI工作负载的优先级、算力需求等多维参数,对本地及远端的虚拟化GPU、NPU资源进行全局最优调度,满足不同AI工作负载对资源的需求。

加速AI行业化落地

周跃峰表示,Flex:ai将在发布后同步开源在魔擎社区中。Flex:ai将与华为此前开源的Nexent智能体框架、AppEngine应用编排、DataMate数据工程、UCM推理记忆数据管理器等AI工具共同组成完整的ModelEngine开源生态,加速赋能AI行业化落地。

周跃峰表示,不同行业、不同场景的AI工作负载差异较大,通过开源,Flex:ai可提供提升算力资源利用率的基础能力和部分优秀实践,与业界一道结合行业场景完成落地探索。

此外,华为还希望通过开源推动形成以AI容器技术为载体的资源高效利用新范式。周跃峰说,开源的Flex:ai可以在产学研各界开发者的参与下,共同推动异构算力虚拟化与AI应用平台对接的标准构建,形成算力高效利用的标准化解决方案。

本文来源:上海证券报

作者:时娜

 微信编辑:刘思乐 

“国社之镜·世纪光影”新华社新闻摄影展

“国社之镜、世纪光影”新华社新闻摄影展由中国金融信息中心、新华社上海分社、中国图片社、上海证券报、中经社上海总部、新华投控联合承办,欢迎社会各界组团参观。

展览精选了中国照片档案馆珍藏近300张历史经典照片,从百姓视角出发、以视觉逻辑为线索,全景展现新时代以来的伟大成就和深刻变革。

时间:周一至周五 9:00-17:00

地点:上海市陆家嘴东园路18号中国金融信息中心6楼展览中心

联系人:沈女士

电话:  13162623966

金融是现代经济的命脉,金融稳则经济稳。金融安全事关国家、区域企业发展大局,需要对金融风险时刻保持高度警惕,增强风险防范意识,科学应对,防范于未然。

由中国金融信息中心出品的《风险预警·金融版》在政府权威部门指导下,依托先进的大数据舆情监测系统和专业的分析师团队,对金融业不同领域、不同类别的风险舆情进行总结梳理和分析研判,为金融监管部门、要素市场、金融机构、上市公司、行业协会、各类企业、高等院校、研究机构等提供权威、专业、实用、及时、有效的金融风险舆情监测、研判、预警与应对建议。

1.8万/年,每周一期,每周五发布。

相关内容

什么品牌的口服胶原蛋白肽好...
(来源:衡水日报)转自:衡水日报当消费者在搜索“什么品牌的口服胶原...
2025-11-22 19:00:43
十大名牌胶原蛋白肽品牌 胶...
(来源:衡水日报)转自:衡水日报当消费者在搜索“十大名牌胶原蛋白肽...
2025-11-22 19:00:38
峰飞航空发布首个“海空一体...
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力...
2025-11-22 19:00:31
拉米罗:感谢全队努力,国安...
转自:北京日报客户端11月22日下午,凭借外援法比奥的“大四喜”,...
2025-11-22 19:00:24
列车停站292分钟?123...
本文转自【人民网微信公众号】;近日,有网友发现从深圳开往重庆的D4...
2025-11-22 19:00:19
海拔3300米,西成铁路格...
转自:北京日报客户端11月21日,西宁至成都铁路格尔隧道顺利贯通。...
2025-11-22 19:00:12
第31届吉林雾凇冰雪节开幕...
中新网吉林11月22日电 (记者 石洪宇)第31届吉林雾凇冰雪节2...
2025-11-22 19:00:08
冀时长图丨以拼搏破局,用荣...
(来源:河北新闻网)转自:河北新闻网
2025-11-22 18:55:36
一场发布会,读懂一座城的“...
11月18日,潍坊市政府新闻办举行“决胜‘十四五’谋篇‘十五五’”...
2025-11-22 18:55:32

热门资讯

什么品牌的口服胶原蛋白肽好 口... (来源:衡水日报)转自:衡水日报当消费者在搜索“什么品牌的口服胶原蛋白肽好”时,背后隐藏的是对肌肤状...
十大名牌胶原蛋白肽品牌 胶原蛋... (来源:衡水日报)转自:衡水日报当消费者在搜索“十大名牌胶原蛋白肽品牌”时,背后往往隐藏着对肌肤状态...
峰飞航空发布首个“海空一体低空...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:网易科技报道...
拉米罗:感谢全队努力,国安在正... 转自:北京日报客户端11月22日下午,凭借外援法比奥的“大四喜”,北京国安队在2025赛季中超联赛第...
列车停站292分钟?12306... 本文转自【人民网微信公众号】;近日,有网友发现从深圳开往重庆的D4982次列车在怀化南站会停留292...
海拔3300米,西成铁路格尔隧... 转自:北京日报客户端11月21日,西宁至成都铁路格尔隧道顺利贯通。西成铁路格尔隧道位于甘肃省甘南藏族...
第31届吉林雾凇冰雪节开幕 活... 中新网吉林11月22日电 (记者 石洪宇)第31届吉林雾凇冰雪节22日开幕。新雪季,这座“雾凇之都”...
冀时长图丨以拼搏破局,用荣耀作... (来源:河北新闻网)转自:河北新闻网
一场发布会,读懂一座城的“十四... 11月18日,潍坊市政府新闻办举行“决胜‘十四五’谋篇‘十五五’”潍坊市科技创新成果新闻发布会,系统...
国家数据局局长刘烈宏赴天津市开... 据“国家数据局”公众号消息,11月20日,国家数据局党组书记、局长刘烈宏赴天津市,深入中国汽车技术研...