打开网易新闻 查看更多图片

在首次部署于物流环境仅三个月后,机器人公司Figure今日宣布其人形机器人Helix的性能与能力实现了重大飞跃。通过一系列模型架构的增强和训练数据的扩展,Helix如今能够处理更多样化、更复杂的包裹类型,其操作速度和灵活性已开始接近人类水平

大家直接看视频,这是Figure放出了的Helix 60分钟无剪辑无加速物流分拣工作视频,非常震撼

打开网易新闻 查看更多视频
仓库实习生3个月“转正”!Figure AI人形机器人在真实的物流仓库中取得了巨大突破

这一快速进展凸显了Figure基于学习的机器人开发方法的可扩展性,能够迅速将理论研究转化为真实的商业应用

核心性能提升

最新的Helix系统在多个关键指标上取得了显著突破:

新增包裹处理类型:除了原有的硬质纸箱,Helix现在能够可靠地处理可变形的塑料袋(Poly Bag)和扁平信封。它能动态调整抓取策略,无论是面对柔软、易褶皱的包裹还是坚硬的物体,都能稳定操作

处理速度大幅提升:尽管任务的复杂性增加,Helix的平均包裹处理速度已从约5.0秒/件提升至4.05秒/件,在保持高精度的同时,效率提升了近20%

条形码扫描成功率飙升:通过改进的视觉系统和控制算法,Helix能更精准地将包裹上的条形码朝向扫描仪,成功率从约70%大幅提升至约95%。

展现自适应行为:Helix学会了类似人类的微妙操作。例如,当遇到表面有褶皱的塑料包装袋时,它会先轻轻拍平包裹表面,确保条形码能够被完整读取。这种复杂的行为并非通过硬编码实现,而是系统从海量演示数据中自主学习到的,以应对真实世界中的不完美情况。

背后技术

这些性能飞跃的背后,是Helix的“视觉-运动策略”模型的两大核心驱动力:模型架构增强训练数据规模化

架构增强:赋予机器人记忆与触觉

Figure的工程师为Helix引入了三大关键模块,使其感知和决策能力更加强大:

打开网易新闻 查看更多图片

视觉记忆(Vision Memory):新的视觉记忆模块让Helix具备了短期记忆能力。它不再仅仅依赖瞬时摄像头画面,而是能整合近期连续的视频帧信息。这意味着,如果初次观察未能看到条形码,Helix会“记得”包裹的其他侧面,并有策略地进行翻转,而不会重复检查同一位置,从而实现更高效、更智能的多步操作

状态历史(State History):模型现在会结合机器人自身(手、躯干、头部)的近期运动历史进行决策。这使得机器人的动作更加连贯和迅速,能够对包裹意外移动等突发情况做出毫秒级响应,显著减少了处理时间

力反馈(Force Feedback):通过将力传感器数据整合到神经网络输入中,Helix获得了基础的“触觉”。它能感知到何时接触包裹、何时包裹被压在传送带上,从而实现更精确的抓取、调节握力,并避免因用力不当导致的失误,使整个系统更加稳健

数据驱动:从10小时到60小时

为了量化各项改进的效果,Figure进行了一系列受控实验。

训练数据规模效应:实验证明,增加人类演示的训练数据量效果显著。当训练数据从10小时增加到60小时,Helix的平均处理时间从6.34秒降至4.31秒,条形码扫描成功率从88.2%攀升至94.4%。这表明系统仍处于数据红利期,未来随着数据量的进一步增加,性能仍有巨大提升空间

打开网易新闻 查看更多图片

架构模块贡献分析(消融研究):通过逐一添加新模块的对比实验(Ablation Study),Figure清晰地展示了每个模块的价值

  • 基线模型(单目视觉):速度最慢(6.64秒/件),因缺乏深度和时间感知而频繁停顿。

  • 立体视觉(Stereo):解决了深度感知问题,抓取更精准,速度提升至5.24秒。

  • 视觉记忆(Vision Memory):消除了不必要的重复检查,时间缩短至4.68秒。

  • 状态历史与力反馈(History & Force):赋予机器人时间和触觉感知,解决了停顿问题,使动作更流畅,时间降至4.31秒,成功率也大幅提升至94.4%。

  • 扩大模型参数:在具备了更丰富的输入信息后,将模型参数量增加50%,进一步将处理时间压缩至4.05秒,同时保持了92.5%的高成功率

通过“视觉条件化”实现人机交互

Helix的端到端模型展现了极高的灵活性。通过在训练数据中加入少量“人类伸出手等待包裹”的演示场景,Helix学会了一项全新的交互技能:人机协作递物

当Helix检测到有人伸出手时,它会理解这个“视觉信号”,并将手中的包裹递给人类,而不是按原计划放到传送带上。整个过程无需任何模式切换或额外编程,完全由同一个神经网络根据不同的视觉情境自主决策。这证明了Helix系统不仅能执行重复性任务,还具备适应新情境、与人类自然协作的巨大潜力

结论

Figure通过扩大高质量的演示数据集,并结合视觉记忆、状态历史和力反馈等关键架构创新,在短短数月内显著提升了Helix机器人在真实物流场景中的性能。

结果表明,数据扩展与架构优化二者缺一不可,共同推动了性能的飞跃。Helix正在稳步缩小学习型机器人操控技术与真实世界复杂任务需求之间的差距。随着技术的不断迭代,一个由人形机器人在速度、效率和灵活性上与人类并肩工作的未来正变得触手可及

参考:

https://www.figure.ai/news/scaling-helix-logistics

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

求赞