56倍加速生成式策略:西交大提出EfficientFlow,迈向高效具身智能
创始人
2025-12-16 12:33:08
0

(来源:机器之心)

本文共同第一作者为西安交通大学硕士生常建磊和博士生梅若风。柯炜为西安交通大学副教授。论文通讯作者为西安交通大学教授许翔宇,其研究方向涵盖三维视觉、生成式 AI 与具身智能(个人主页:https://xuxy09.github.io/)。

生成式模型正在成为机器人和具身智能领域的重要范式,它能够从高维视觉观测中直接生成复杂、灵活的动作策略,在操作、抓取等任务中表现亮眼。但在真实系统中,这类方法仍面临两大「硬伤」:一是训练极度依赖大规模演示数据,二是推理阶段需要大量迭代,动作生成太慢,难以实时控制。

针对这一核心瓶颈,西安交通大学研究团队提出了全新的生成式策略学习方法 EfficientFlow。该方法通过将等变建模与高效流匹配(Flow Matching)深度融合在显著提升数据效率的同时,大幅压缩推理所需的迭代步数,在多个机器人操作基准上实现了 SOTA 的性能,并将推理速度提升一个数量级以上。

相关论文《EfficientFlow: Efficient Equivariant Flow Policy Learning for Embodied AI》已被 AAAI 2026 接收,代码已开源

  • 论文地址:https://arxiv.org/pdf/2512.02020

  • 项目主页:https://efficientflow.github.io/

  • GitHub:https://github.com/chang-jl/EfficientFlow

技术亮点:用物理直觉重塑生成式策略

1. 加速度正则化:让生成轨迹更直、更快

传统流匹配的一大痛点是学习到的流场曲率过大,导致推理时仍需多步迭代才能拟合。

怎么让生成轨迹变直? EfficientFlow 的设计灵感源于物理直觉:现实中平滑的运动,往往加速度很小。 因此,EfficientFlow 在损失函数中引入了加速度正则项,鼓励样本从噪声分布向数据分布演化的过程也是平滑且接近匀速的:

其中是正则化系数。在实践中,采用

时则优先考虑准确性。

,在早期时间鼓励更平滑的轨迹,而在

加速度正则项可以近似为:

然而,该式难以直接计算,因为

位于同一条未知的流轨迹上。为克服这一困难,EfficientFlow 引入了流加速度上界(FABO):

和 

其中,和 

 来自同一个条件概率路径,很容易通过采样得到。

本质上,FABO 是一个易于计算且有效的代理损失。同时,上界 FABO 与原式的差值等效于 

的正则化,让模型生成的策略更稳、更鲁棒。

,可以看作对雅可比矩阵 

2. 等变网络:让模型学会「举一反三」

EfficientFlow 等变设计的核心逻辑非常直观:如果输入的视觉场景旋转了一定角度,那么机器人输出的动作自然也该跟随旋转相同的角度。这带来了巨大的数据优势,相当于一条数据就可以产生多条数据的效果。模型只需学习物体在一个角度下的操作,就能自动泛化到多个旋转角度,真正实现了「举一反三」。

EfficientFlow 基于 escnn 库构建,将机器人在时间的动作表示为一个 10 维向量 

,包含 6D 旋转表示、3D 平移向量和标量抓手宽度。动作输出对应的等变表示为:

这种表示使得

对称性的预测动作,从而确保在场景进行平面旋转时行为的一致性。

能够生成遵循任务 

等变网络和观测。模型将等变群设定为一个有限循环子群 映射为嵌入  映射为嵌入  与时间 t 一起被输入到等变神经网络中。得益于各部件的等变设计,模型实现了从原始输入到预测动作的全流程 等变性。

,编码后的嵌入

,使用一个等变动作编码器将动作序列

,使用一个等变观测编码器将观测

的输入是时间 、动作序列 

3. 时间一致性策略:快,还要稳

在生成动作序列时,由于相邻的片段通常是独立预测,策略可能会在不同的行为模式间切换,导致长期执行过程中的不连贯。为了解决这个问题,EfficientFlow 采用 Diffusion Policy 中的时间重叠策略:每个预测序列仅执行前 步,而剩余的 

开始的后续预测重叠。通过生成具有相似重叠部分的相邻动作序列,可以实现长期的连贯性。

 步则与从时间 

受 IMLE Policy 的启发,算法还采用了一种批量轨迹选择与周期性重置策略,该策略在多模态表达能力与时间连贯性之间取得了平衡。在推理阶段,EfficientFlow 从高斯分布中采样 m 个初始噪声向量 

。然后,选择重叠片段与上一条轨迹匹配度最高的轨迹执行。

,并通过模型演化每一个向量,生成 m 条候选动作轨迹 

为了保持模型探索多样化行为的能力,模型引入了周期性重置:每 10 个预测周期,从批次中随机选择一条轨迹进行执行,而不是选择最小化重叠距离的那一条。这种方法在保持多模态性的同时提高了时间一致性,并且由于并行化处理,批量化设计确保了推理时间的额外开销极小。

实验效果:少数据、少步数,也能打 SOTA

在 MimicGen 等多个机器人操作基准中,EfficientFlow 在有限数据条件下展现出媲美甚至超过现有 SOTA 方法的成功率。更关键的是推理效率:在 1 步推理下,EfficientFlow 就能接近 EquiDiff 100 步推理的平均性能,单步推理速度提升 56 倍,5 步推理也有近 20 倍加速。消融实验进一步表明,加速度正则化与等变建模缺一不可,共同构成了高效生成式策略的关键。

相关内容

外交部回应日本拟在冲绳部署...
(来源:中国妇女网)转自:中国妇女网12月18日,外交部发言人郭嘉...
2025-12-18 17:37:47
南京医药:拟1.2亿元参设...
转自:证券时报人民财讯12月18日电,南京医药(600713)12...
2025-12-18 17:37:38
优质养老 延庆首批养老服务...
养老服务好不好?试住一下就知道!为让全区老年朋友享受到优质安心的养...
2025-12-18 17:28:55
期货日报|为海南自贸港建设...
“海南省政府部门干部期货及衍生品业务专题培训班”开课期货日报 记者...
2025-12-18 17:28:51
证券时报|期货“郑”能量 ...
期货日报记者 邬梦雯从新中国第一家期货交易所落地,到“郑州价格”享...
2025-12-18 17:28:46
视频丨多国人士:海南自贸港...
转自:央视新闻客户端  海南自由贸易港全岛封关运作18日正式启动。...
2025-12-18 17:28:41
云南已有28个地理标志农产...
来源:人民日报海外版 本报昆明电(记者叶传增)记者从云南省农业农村...
2025-12-18 17:28:36
海峡股份:回应新海港折旧承...
投资者提问:新海港的折旧是否由公司全额承担,新海港核心服务对象是实...
2025-12-18 17:28:32
宁波建工子公司联合体中标7...
宁波建工股份有限公司(证券代码:601789,简称“宁波建工”)1...
2025-12-18 17:28:25

热门资讯

外交部回应日本拟在冲绳部署雷达... (来源:中国妇女网)转自:中国妇女网12月18日,外交部发言人郭嘉昆主持例行记者会。有记者问:据报道...
南京医药:拟1.2亿元参设南药... 转自:证券时报人民财讯12月18日电,南京医药(600713)12月18日公告,公司拟与南京新工新兴...
优质养老 延庆首批养老服务试住... 养老服务好不好?试住一下就知道!为让全区老年朋友享受到优质安心的养老服务日前延庆区民政局
期货日报|为海南自贸港建设贡献... “海南省政府部门干部期货及衍生品业务专题培训班”开课期货日报 记者 乔林生近日,由海南省委金融办、海...
证券时报|期货“郑”能量 助“... 期货日报记者 邬梦雯从新中国第一家期货交易所落地,到“郑州价格”享誉世界,从多个契合河南产业体系的期...
视频丨多国人士:海南自贸港全岛... 转自:央视新闻客户端  海南自由贸易港全岛封关运作18日正式启动。多国人士表示,海南自贸港封关运作为...
云南已有28个地理标志农产品 来源:人民日报海外版 本报昆明电(记者叶传增)记者从云南省农业农村厅获悉,云南推动高原特色现代农业地...
海峡股份:回应新海港折旧承担、... 投资者提问:新海港的折旧是否由公司全额承担,新海港核心服务对象是实际持股约34%的轮渡公司。基于此,...
宁波建工子公司联合体中标7.4... 宁波建工股份有限公司(证券代码:601789,简称“宁波建工”)12月19日发布公告称,公司下属控股...
天有为电子4.5亿元闲置募集资... 近日,黑龙江天有为电子股份有限公司(证券简称:天有为,证券代码:603202)发布公告称,公司此前使...