经济观察网 11月21日,2025AI容器应用落地与发展论坛在上海举行。
华为公司副总裁、数据存储产品线总裁周跃峰在论坛期间发布AI容器技术——Flex:ai。与此同时,华为公司联合上海交通大学、西安交通大学与厦门大学共同宣布,将此项产学合作成果向外界开源,助力破解算力资源利用难题。
当前,AI产业高速发展催生海量算力需求,但全球算力资源利用率偏低的问题日益凸显,“算力资源浪费”成为产业发展的关键桎梏,包括小模型任务独占整卡导致资源闲置,大模型任务单机算力不足难以支撑,大量缺乏GPU/NPU的通用服务器更是处于算力“休眠”状态,供需错配造成严重的资源浪费。
Flex:ai XPU池化与调度软件基于Kubernetes容器编排平台构建,通过对GPU、NPU等智能算力资源的精细化管理与智能调度,实现AI工作负载与算力资源的精准匹配,可大幅提升算力利用率。
据悉,这项技术深度融合三大高校与华为的科研力量,形成三大核心技术突破:一是算力资源切分,一卡变多卡,服务多个AI工作负载;二是跨节点算力资源聚合,充分利用空闲算力; 三是多级智能调度,实现AI工作负载与算力资源的精准匹配。
周跃峰表示,Flex:ai的全面开源开放,将向产学研各界开发者开放所有核心技术能力——通过汇聚全球创新力量,共同推动异构算力虚拟化与AI应用平台对接的标准构建,形成算力高效利用的标准化解决方案,为全球AI产业的高质量发展注入强劲动能。