要点:
Figure AI通过其创新的Helix系统,将人形机器人从汽车制造领域扩展至物流行业,推动机器人在劳动力市场中的应用,逐步改变未来工作方式。
科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。
狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。
狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。
联系我们// 相关文章
在科技不断进步中,人形机器人领域始终备受瞩目,而将人形机器人引入劳动市场是美国机器人创业公司“Figure AI”的使命核心。
去年8月,Figure发布人形机器人Figure 02,并在宝马/BMW汽车的流水线上从事汽车装配的工作。短短半年时间,如今搭载自研机器人大模型Helix系统1(S1)的Figure已经将人形机器人从汽车领域进军物流领域应用。随着Helix的不断创新与突破,人形机器人与人类“抢饭碗”的速度也日益推进,或将成为推动机器人智能化进程的重要里程碑。
Figure人形机器人新应用:物流包裹操作和分类
2月26日,Figure公司发布了一段短视频,宣布其机器人已成功掌握了新的工作技能:在物流中心进行快递包裹的整理和分类。
包裹处理和分类是物流行业中的一项基础作业,通常涉及将包裹从一条传送带转移到另一条传送带,并确保运输标签方向正确,以便扫描。这个任务面临着一些重要的挑战:包裹在尺寸、形状、重量和刚性上各不相同。此外,从刚性盒子到可变形的袋子都有,这使得模拟过程变得更加复杂。
据Figure发布的视频显示,机器人能够识别、抓取并按逻辑摆放快递包裹。虽然与高效的人类分拣工相比,机器人的效率尚有差距。但公司目前宣布,上周日已在客户现场成功验证了这一机器人流程的可行性。 Figure对此表示,通过端侧的视频流,机载的Helix AI模型将帮助机器人识别并扫描包裹上的条形码。
系统需要精准判断何时以及如何抓取移动中的物体,并在重新定位包裹时确保标签朝向正确。同时,它还需要跟踪传送带上大量包裹的动态流动,以保持高吞吐量。由于环境无法完全预测,系统必须具备自我修正的能力。解决这些挑战不仅是Figure业务的关键应用,也为Helix System 1带来了通用的技术提升,其他所有应用场景也能从中受益。



自研机器人大模型:Helix系统1(S1)的架构改进
Helix是Figure内部设计的视觉-语言-动作/VLA模型,它将感知、语言理解和学习控制统一起来,旨在整合感知、语言理解和学习控制,从而解决机器人技术领域长期以来的多个挑战。
Helix的主要创新点在于其端到端的控制能力,这意味着机器人可以在接收到任务指令后,自动进行规划和执行,而无需经过繁杂的分层模型流程。这一过程的简化,不仅提高了机器人的响应速度,也使得其在复杂环境中的适应性和自我修正能力显著增强。
而此次Figure在物流应用场景的突破,重点放在对Helix的系统1(S1),即低阶视觉运动控制策略所做的一系列总体改进,同时对这个具有挑战性的新商业用例进行了迭代:
视觉表现- Figure之前的系统1依赖于单目视觉输入,而现在的新系统1釆用了立体视觉主干,并结合多尺度特征提取网络,以捕捉更丰富的空间层次。与单独处理每个摄像头输入的影像特征不同,Figure将来自两个摄像头的特征合并到多尺度立体网络中,之后进行标记,这样不仅避免了计算开销,还保持了输入到交叉注意力转换器的视觉标记总数不变。多尺度特征让系统能够解读细节和更广泛的上下文信息,共同促进了更可靠的视觉控制。

交叉机器人传送-在多机器人部署单一策略时,需要克服由于机器人硬件差异带来的观察与行动空间分布变化问题。这些差异包括传感器校准的不同(影响输入观察)和联合响应特性(影响动作执行),如果没有适当的补偿,可能会影响策略性能。特别是在高维度的全身动作空间中,传统的手动机器人校准方法无法扩展到整个机器人群体。
因此,Figure训练了视觉本体感知模型,根据每个机器人的机载视觉输入,估计末端执行器的6D姿势。通过这种在线“自我校准”方法,Figure实现了强大的跨机器人策略迁移,并最大限度地减少了停机时间。
数据管理-在数据管理方面,Figure特别注重筛选人类演示,排除那些速度较慢、失误或失败的演示。然而,对于那些因环境随机性而非操作员错误造成的故障,Figure故意保留了包含纠正行为的演示。与远程操作员的紧密合作,不仅改进了操作策略,还使得策略得以统一,从而带来了显著的进步。
推理时间操作加速- Figure的系统目标是达到并最终超越人类操控速度。为此,Figure釆用了一种简单有效的测试时间技术,使得机器人学习行为比演示者更快:通过插入策略动作区块输出(我们称之为“运动模式”)。 Figure的S1策略输出动作“块”,代表每秒200次的机器动作。例如,通过将[T x action_dim]的动作块(代表T毫秒轨迹)线性重新釆样为更短的[0.8 * T x action_dim]轨迹,从而实现了约20%的测试时间加速,且无需修改训练过程。
Figure机器人技术
Figure使用标准化有效吞吐量* T_eff 来衡量系统的效能,它表示与训练的演示资料相比,包裹的处理速度有多快。如果有必要,这会考虑重置系统所花费的任何时间。举例来说,T_eff > 1.1 表示操作速度比训练时收集的专家轨迹快10%。
立体声的重要性-图2(a)显示了添加多尺度特征提取器以及立体声输入对系统T_eff 的影响。多尺度特征提取以及隐式立体声输入都显著提高了系统性能。特别值得注意的是,在添加立体模型后,对各种封装尺寸的稳健性得到了提高:如图2 (a) 所示,立体模型的吞吐量相对于非立体基线提高了60%。

此外,配备立体模型的S1 模型将会指导机器人寻找并扫描快递上的条形码,甚至在处理信封类包裹时,可对包裹进行翻转及压平。
质胜于数量-对于单一用例,资料品质和一致性比资料数量更重要。图2 (b) 显示,使用精选的高品质演示训练的模型,尽管使用的资料减少了⅓,但吞吐量却提高了40%。
运动模式-透过线性重采样(「运动模式」)加速策略执行的效果令人惊讶,速度最高可提高50% 。这很可能是由于动作输出区块的高时间解析度(200Hz)而实现的。然而,当加速超过50% 时,有效吞吐量开始大幅下降,因为动作变得太不精确且系统需要频繁重置。图3 显示,与训练专家轨迹相比,速度提高50% 后,策略实现了更快的物体处理速度(T_eff>1)。

跨机器人传送-最后,透过利用学习到的校准和视觉本体感受模组,我们能够将最初针对单一机器人的资料进行训练的相同策略应用于多个其他机器人。尽管感测器校准存在差异且硬体差异很小,但系统在所有平台上都保持了相当的操控性能水准。这种一致性强调了学习校准在减轻协变量变化方面的有效性,有效地减少了对每个机器人进行繁琐的重新校准的需要,并使大规模部署更加实用。
结论- Figure展示了如何利用高品质的资料集与立体多尺度视觉、线上校准和测试时间加速等架构改进,在现实世界的物流分类场景中实现比演示者更快的灵巧机器人操作——同时使用相对适量的演示资料。结果凸显了将端到端视觉运动策略扩展到速度和精确度至关重要的复杂工业应用的潜力。

Figure机器人:技术革新推动智能化未来
从技术角度来看,Helix通过一个单一的神经网络实现了对机器人全身的控制,涵盖了手腕、头部、手指等多个关键部位。借助机器学习和深度学习算法的统一控制,Helix使得机器人能够更智能地识别和处理各类物体,无论是静态物体(如鸡蛋),还是动态物体(如活动中的仙人掌),都能高效完成任务。这一技术突破使Helix在学习和执行新行为的效率上远超传统控制模型,尤其在处理复杂任务时展现了强大的协作能力。
Figure创始人兼CEO Brett Adcock曾对此公开表示,“我们相信,要在现实世界中大规模解决实体人工智能的问题,必须对机器人人工智能进行垂直整合。”这一观点不仅揭示了Figure与OpenAI战略分歧的根源,也反映了其对未来机器人产业发展的战略思考。这一趋势将加速各行业对机器人的需求,特别是在服务业、制造业和日常生活场景中。
Helix的商业可行性受关注
Figure公司表示,Helix能够在低能耗的嵌入式GPU上顺利运行,这意味着其产品可以迅速投入到实际商业部署中。这一特点将为不同企业提供更多实用场景,尤其是在需要大量重复性操作的环境中,如仓储和物流行业。
而在市场反应方面,Figure已与多家国内核心零部件企业达成合作,包括提供模切结构件和金属结构件的领益智造,以及长盈精密和兆威机电等。通过这些合作,Helix技术将加速成熟与普及,为其在全球市场的立足打下坚实基础。
随着技术不断推动机器人领域的发展,Figure AI所推出的Helix控制模型不仅代表了机器人工业的突破,更象征着我们对智能化未来的探索与追求。人形机器人不再是科幻中的想象,而正逐步走入我们的生活与工作场景,改变着传统产业的运作方式。从服务业到制造业,再到日常生活中的各个领域,机器人的普及将有效提升工作效率,推动社会的智能化转型,并逐步和人类在“抢饭碗”。
在这一过程中,Figure公司通过不断创新,强化机器人与人类协作的能力,正在为未来科技的发展奠定重要基础。随着更多智能化、可持续的解决方案不断涌现,我们有理由相信,机器人技术将成为推动社会进步和产业升级的关键力量。
科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。
狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。
狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。
联系我们// 相关文章