近日,北京人形机器人创新中心以直播的方式展示了人形机器人“大脑”的最新突破。搭载通用具身智能平台“慧思开物”的智能体,在行业首次实现全局场景感知与动态记忆突破,可以做到眼里有活、手里有数,为日后人形机器人走向家庭、商业、工业场景提供了可直接落地的智能底座。
去年,北京人形机器人创新中心发布全球首个实现“一脑多机”“一脑多能”的通用具身智能平台——慧思开物,为机器人配备更聪明的“大脑”和“小脑”。该平台在发布之初就颠覆了传统机器人基于单一场景、单一任务做专项开发的传统模式,推动提升机器人在复杂环境里自主决策与执行能力。
如今,搭载了慧思开物平台的智能体,实现了空间记忆等核心突破,让机器人实现了从被动执行到主动干活、从执行“短视”的简单任务到完成长程的复杂任务的关键跨越。
传统机器人依赖瞬时视觉,“所见即所得”。一旦物体离开机器人的视野便相当于“消失”,场景发生变化后机器人也跟着“失忆”了,无法完成复杂推理与长程任务。这就很难使其像人一样干复杂的活。
直播中,慧思开物Agent(智能体)以真机实时运行的方式,展示了机器人流畅完成递水、拿纸巾等任务。整个过程中,机器人有了“空间感”。即使物品离开视野,机器人仍可精准定位,不再只是处理眼前的工作,还能根据空间记忆推理出目标物体的位置、状态与环境的关系。
这是因为北京人形机器人创新中心为其打造了行业首个全局场景感知与动态空间记忆系统,它配备的“动态语义地图”,可以记录看到的物体类别、颜色、位置等并实时更新,系统还能实现跨时间、跨视角持久记忆。
“根据实际测试,机器人在涉及多步移动、感知、抓取等的复杂多步骤长程任务中,这套空间记忆完整链路的准确率都能够稳定在100%。”北京人形机器人创新中心相关负责人解释,即便在面对视角切换、物体遮挡等常见扰动的影响下,整体任务完成率仍维持在98%以上。
这意味着,机器人真正拥有全局空间记忆和常识,在家庭取物、物料分拣、物流整理等场景中,即便视角切换、物体遮挡、环境变化,依然能稳定完成任务。
现在的机器人还有个痛点:记不住人、分不清偏好,每次与同一个人交互都像第一次见面,做每一项工作都像第一次做。为此,慧思开物Agent通过一套用户记忆系统,实现拟人化主动交互,让机器人可以分辨出来谁是谁,只要见过一次,就能长期记住行为偏好,提供个性化服务。
比如,用户随口说“口渴”时,机器人通过人脸匹配调取历史记忆,识别出用户偏爱可乐,主动为用户把可乐取来。它还能让机器人具备跨任务上下文延续能力。当用户下达“继续做昨天的事”“把上次的文件给我”等跨时间任务,机器人也能“想”起来。
“正因如此,机器人还可以自主感知环境、主动发现需求,做到眼里有活。”相关负责人说,通过这一技术的突破和延展,机器人不再是冰冷的执行机器,而是记得你、理解你、主动服务你的智能伙伴。
机器人不仅要眼里有活,还得“手上有数”。过去,让机器人抓取某些物品时,它往往能抓得起来,但抓不好、控不住。为了解决这个行业难题,慧思开物Agent搭载“视觉+触觉”的感知能力,能根据目标物品的特性调节自己的抓取力度,让机器人更有感知、更能理解,最终实现“手上有数”的效果,日后也能安全、精准、稳定地干活。
来源:北京日报
下一篇:奔走田间,派送增收“密码”