Boston Dynamic波士頓動力人形機器人Atlas全面升級,邁向自主智能的階段

Boston Dynamic波士顿动力人形机器人Atlas全面升级,迈向自主智能的阶段

發布日期:

狂呼科技 Convo Tech 科技 Tech


要点:
随着人工智能和机器人技术飞速进步,波士顿动力公司通过升级人形机器人Atlas的感知系统,实现了机器人在复杂环境中自主感知与灵活应变的关键突破。

随着人工智能AI与机器人技术的快速发展,“自主性”已成为衡量新一代机器人实用价值的关键指标。过去,机器人往往依赖精确预编程完成单一任务,难以应对现实世界中瞬息万变的环境与突发状况。然而,若机器人能像人类一样,主动感知环境、即时调整策略、灵活处理未预期的挑战,便可真正走出实验室,进入工厂、仓储乃至日常生活之中。

波士顿动力公司/Boston Dynamic针对其人形机器人Atlas的感知系统所进行的重大升级,搭载了全新的感知系统,象征着机器人技术向自主智能迈出关键一步。升级后的Atlas不仅能更精确地掌握周遭环境,还具备在工厂等复杂工业场景中独立完成任务的能力。虽然其灵活动作早已广受瞩目,该公司此次更强调感知能力在实现机器人自主作业中的核心地位。

Boston Dynamic Atlas升级全感知系统

波士顿动力公司在一段虽然叙述简略但内容丰富的影片中,展示了Atlas如何因应现场环境的持续变化。虽然任务本身看似仅是分类汽车零件,但影片背后的重点在于:开发团队正致力于让Atlas不仅能完成预设操作,更能灵活调整策略、主动应对突发情况。

影片中,有员工刻意改变零件架的位置,测试机器人的适应能力。 Atlas必须在动态变化的空间中重新评估任务参数,并迅速做出调整。又如另一场景,一个零件被不慎掉落并发出声响,Atlas虽无法根据声音进行精准定位,却能藉由视觉扫描锁定目标并成功完成拾取与归位,显示出其视觉系统与推理能力的进步。

这段展示也深刻体现了莫拉维克悖论:对人类而言简单的感知与动作协调,对机器人却极为复杂。而人类难以处理的大量计算,反而是机器的强项。正因如此,Atlas的开发重点之一,是让其感知系统具备高度灵活性与误差容忍度。

举例而言,若零件架的边距只有五公分,哪怕抓取时偏移一公分,都可能导致任务失败。因此Atlas必须能在操作过程中即时调整动作,甚至在发生错误后,自主进行修正。

而这些能力背后,依赖的是由多个高阶技术构成的感知架构:包括高度校准的视觉与运动整合系统、最先进的机器学习模型,以及精确的状态估计机制。每一个步骤,从辨识物体、判断其位置与姿态、决定操作策略,到最终精准放置物件,都需仰赖深度的环境理解与即时反应能力。

实际应用中,像Atlas这样的机器人需在充满反光、昏暗或拥挤物体的环境中运作,要成功抓取并准确摆放一个零件,其实仰赖的是高度的感知推理能力。针对这些挑战,波士顿动力开发了一套融合2D与3D感知技术的视觉系统,搭配物体姿态追踪与视觉-动作的精密校准机制,使Atlas能更灵活、准确地理解与操作现实世界。

2D物件辨识与关键点预测技术

感知系统的首要任务,是判断机器人周遭的环境状况,例如是否存在障碍物?有哪些目标物件?地面是否潜藏风险?为此,波士顿动力运用2D物体侦测系统,以物件的类别、边界框与关键点等资讯,提供环境的初步解析。

在这项应用中,Atlas必须辨识工厂中用来存放汽车零件的各式大型货架装置。这些固定装置形状与尺寸各异,机器人需要明确掌握它们的类型与占据空间,才能有效规避碰撞风险。除了辨识各种货架外,Atlas还会将它们的角落视为关键点,使感知资料能与已知模型准确对齐。

这些固定装置的关键点以2D像素座标呈现,分为两种类型:外部关键点(绿色)和内部关键点(红色)。前者描绘货架外部的包络轮廓,例如正面四个角落。后者则更具细节性,对应于货架内部的架构与小型隔间,帮助系统精准对位每一个物件槽位。

为实现即时的分类与关键点预测,Atlas采用一种轻量化的神经网络架构,在效能与即时反应之间取得最佳平衡。这种设计对于机器人在变化多端的环境中保持灵活性与稳定性至关重要。

利用3D感知应该如何与物体互动

除了以上,为了准确操控固定装置内的物体,Atlas必须首先判断自身相对于这些装置的位置与方向。为此,它运用一套基于关键点的定位模组,能够针对周围所有货架装置进行相对定位与姿态估算。

这个定位系统从物体侦测流程中提取出固定装置的内外关键点,并透过最小化重投影误差,将这些观察点与预先建立的空间模型对齐。同时,系统整合了Atlas的运动里程资讯,藉由跨时间的帧一致性,进一步提升关键点预测的稳定性与准确度。

在实务操作中,一大挑战是处理视野受限与关键点遮蔽的情况。例如,当Atlas靠近货架时,部分外部关键点可能完全被遮挡;在角度偏斜的视角下,距离较远的点也变得不可靠。为克服这些限制,系统会大量观察来自装置内部、如插槽隔间之间角落等丰富的关键点,这些位置与实际的抓取或放置行为密切相关。

这同时也引入另一个挑战:如何将影像中的二维关键点对应到三维空间中的实体角点? Atlas首先利用外部关键点估算装置的大致姿态,再据此推断内部关键点的可能对应关系。内外资讯的结合,则有助于建构出整体装置与各插槽更为可靠的三维定位结果。

此外,许多固定装置在外观上极为相似,这类装置类在工厂环境中十分常见,也带来额外的辨识难题。为解决这一点,Atlas融合了时间一致性以及空间先验知识,例如装置A位于装置B的右侧50公分处,以此强化辨识的区分能力。

这一整套机制构成了Atlas灵活且稳定的固定装置感知系统。从影片中可见,当某人悄悄移动Atlas身后的装置时,机器人能迅速察觉预期与现况的偏差,并立即重新定位该装置,进而调整行动策略,展现出高度的自主反应能力。

Atlas之所以具备灵活高效的物体操作能力,关键在于其快速而精准的以物体为核心的感知系统。这项能力依赖于Atlas的物体姿态追踪系统SuperTracker,它融合来自运动学、视觉与必要时的力觉等多源资讯,以实现稳定追踪。

Atlas可透过其关节编码器提供的运动学资料,精准得知自身夹持器的位置。当其判定已成功抓取物体时,该资讯可作为物体在移动过程中应处位置的强大先验,有效应对因遮蔽或物体超出视野所带来的视觉资讯缺失;若物体自手中滑脱,系统亦能即时做出警示。

在物体处于摄影机可视范围时,Atlas会启用姿势估计模型,透过影像渲染与比较的方式,从单目影像中估算物体姿态。该模型经由大量合成资料训练,能依据CAD模型将零样本学习推广至全新物件。初始化姿势可基于3D先验或2D区域资讯(如物体遮罩),随后产生多组假设并由评分模型筛选最佳拟合值,进一步细化输出。此模型已在我们内部数百种具CAD与纹理资料的工厂资产上证实其稳定性与通用性。

SuperTracker将视觉姿态估计作为三维空间中的初步参考,并搭配一系列验证与滤波程序来提升可靠性,特别是在面对遮蔽、部分可见或光线变化等挑战时:

自我一致性验证-从多个扰动初始化出发,并采用最大团共识演算法,确认所有预测收敛至一致的姿态。

运动一致性验证-排除任何导致Atlas手指与物体距离异常大的姿势,作为物理接触的合理代理。

非同步数据整合-利用固定滞后平滑器处理高速的运动学数据与较低频率的视觉输出,最终产生准确的6自由度物体轨迹。

执行如分类、插放等精细操作时,手眼协调的精准性至关重要。这意味着Atlas的视觉感知必须与其动作控制紧密对齐。上这样的精度来自于一套严谨的摄影机与运动系统校准机制,能有效补偿制造与组装中的误差,以及长期运作下因热变形或反覆撞击所产生的结构偏差。我们的经验表明,精准的手眼校准是高性能操控与自主感知的根本条件。

但这一切仍只是起点。波士顿动力的最终目标是打造真正敏捷且具备自我调整能力的系统,这不仅需要空间上的智慧,也需要理解运动的几何、语义与物理规律。目前,该公司正致力于为Atlas建构一个统一的基础模型架构。未来,感知与行动将不再是分离的模组,而是紧密交融的整体,让Atlas从空间智能迈向真正的运动智能。

这一切的发展不仅是技术突破的体现,更标志着人机关系的一次深刻转变。在过去,机器人仅是人类指令的延伸,但如今,像Atlas这样的系统正逐步具备主动理解环境、预判情境、并灵活应对的能力。当机器人不再只是工具,而成为能与人类协作、共享任务责任的智能体时,我们也将重新定义什么是“智能”与“体力”的界线。 Atlas的进化,不只是科技的胜利,更是我们对未来生活方式的一次预演,一个人机共生、灵活应变、智能协作的新时代正悄然展开。

狂呼科技 Convo Tech

科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。

狂呼科技,研究,聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。

狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • AMZN亞馬遜AWS本季營收同比增長20.2%到$309億!

    AMZN亚马逊AWS本季营收同比增长20.2%到$309亿!

    久等的AWS 提速终于到来:目前云业务的增速几乎成为了压倒一切、“决定生死” 的单一指标。而AWS 本季营收同比增长20.2% 到$309 亿,相比上季增速明显提升2.7pct。市场久久期待的AWS 增长再提速终于到来。

    AMZN亚马逊AWS本季营收同比增长20.2%到$309亿!

    久等的AWS 提速终于到来:目前云业务的增速几乎成为了压倒一切、“决定生死” 的单一指标。而AWS 本季营收同比增长20.2% 到$309 亿,相比上季增速明显提升2.7pct。市场久久期待的AWS 增长再提速终于到来。

  • AAPL蘋果2025財年第四季度營收1025億美元,同比增長7.9%!

    AAPL苹果2025财年第四季度营收1025亿美元,同比增长7.9%!

    本季度苹果公司实现营收1025 亿美元,同比增长7.9%,基本符合市场预期(1020 亿美元)。公司本季度收入端的提升,主要受益于iPhone、Mac 和软件服务业务增长的带动。苹果公司毛利率 47.2%,同比增加1pct,好于市场一致预期(46.6%)。

    AAPL苹果2025财年第四季度营收1025亿美元,同比增长7.9%!

    本季度苹果公司实现营收1025 亿美元,同比增长7.9%,基本符合市场预期(1020 亿美元)。公司本季度收入端的提升,主要受益于iPhone、Mac 和软件服务业务增长的带动。苹果公司毛利率 47.2%,同比增加1pct,好于市场一致预期(46.6%)。

  • RBLX業績指引隱含增速放緩?

    RBLX业绩指引隐含增速放缓?

    RBLX四季度指引隐含增速放缓过快:在三季度70% 的跳跃式增长下,四季度指引流水增速迅速放缓到50% 达到20 亿,意味着环比只增加了4%,年化未来一年的增速为17% 低于20% 的长期目标。

    RBLX业绩指引隐含增速放缓?

    RBLX四季度指引隐含增速放缓过快:在三季度70% 的跳跃式增长下,四季度指引流水增速迅速放缓到50% 达到20 亿,意味着环比只增加了4%,年化未来一年的增速为17% 低于20% 的长期目标。

  • META財報Opex蹭蹭漲,市場慌了?

    META财报Opex蹭蹭涨,市场慌了?

    META Opex 蹭蹭涨:大模型进展不顺,AI 实验室高薪挖人,挖完又大裁员。再加上高增长的折旧费用,引发市场对支出不受控的担忧。三季度这个担忧正在被印证:研发同比高增35%,管理支出因为法务支出、员工薪资高增等,同比更是增长了88%,彻底重回高增区间。

    META财报Opex蹭蹭涨,市场慌了?

    META Opex 蹭蹭涨:大模型进展不顺,AI 实验室高薪挖人,挖完又大裁员。再加上高增长的折旧费用,引发市场对支出不受控的担忧。三季度这个担忧正在被印证:研发同比高增35%,管理支出因为法务支出、员工薪资高增等,同比更是增长了88%,彻底重回高增区间。

  • MSFT微軟業績不俗,但Azure沒有意外之喜

    MSFT微软业绩不俗,但Azure没有意外之喜

    整体上,本季微软业绩不俗,几乎没有缺点,各项指标普遍好于预期。问题在于作为最被一致看多的标的,市场对微软的期待非常高。可以说,需要大幅度的超预期,才能再让市场感到惊喜。且本季核心Azure 增速并未好于买方预期,让市场对微软本季业绩反应平平。

    MSFT微软业绩不俗,但Azure没有意外之喜

    整体上,本季微软业绩不俗,几乎没有缺点,各项指标普遍好于预期。问题在于作为最被一致看多的标的,市场对微软的期待非常高。可以说,需要大幅度的超预期,才能再让市场感到惊喜。且本季核心Azure 增速并未好于买方预期,让市场对微软本季业绩反应平平。

  • GOOG谷歌2025年三季度財報,交了一份漂亮的業績!

    GOOG谷歌2025年三季度财报,交了一份漂亮的业绩!

    Alphabet 发布了2025 年三季度财报。在顶着OpenAI 的风头靠着全栈AI 的逻辑重估了两个月,直接修复空间有限、市场急需进一步上涨理由的时候,谷歌硬是交了一份漂亮的业绩,来延续自己的重估之路。

    GOOG谷歌2025年三季度财报,交了一份漂亮的业绩!

    Alphabet 发布了2025 年三季度财报。在顶着OpenAI 的风头靠着全栈AI 的逻辑重估了两个月,直接修复空间有限、市场急需进一步上涨理由的时候,谷歌硬是交了一份漂亮的业绩,来延续自己的重估之路。

  • 和獨響APP王登科聊:消失的附近、深度關系與AI帶來的新觸點 | 播客Podcast

    和独响APP王登科聊:消失的附近、深度关系与AI带来的新触点| 播客Podcast

    独响APP创造了复杂的行为Agent 模式,让AI 更立体,围绕你的生活,和你喜欢的AI角色建立舒服,正向,长期的关系,和TA们一起轻松创建你的自定义角色,不管开心还是难过,你可以获得足够的情绪支持,舒服,不累的建立和AI朋友们的关系。

    和独响APP王登科聊:消失的附近、深度关系与AI带来的新触点| 播客Podcast

    独响APP创造了复杂的行为Agent 模式,让AI 更立体,围绕你的生活,和你喜欢的AI角色建立舒服,正向,长期的关系,和TA们一起轻松创建你的自定义角色,不管开心还是难过,你可以获得足够的情绪支持,舒服,不累的建立和AI朋友们的关系。

  • INTC英特爾2025年第三季度財報毛利率環比大幅回升!

    INTC英特尔2025年第三季度财报毛利率环比大幅回升!

    INTC本季度实现营收136.5亿美元,同比微增2.8%,略超公司指引上限,主要是受客户端业务回暖的带动。本季度毛利率环比大幅回升至38.2%,明显好于指引预期(34.1%)。上季度毛利率的“闪崩”,主要是受非经营性费用影响。

    INTC英特尔2025年第三季度财报毛利率环比大幅回升!

    INTC本季度实现营收136.5亿美元,同比微增2.8%,略超公司指引上限,主要是受客户端业务回暖的带动。本季度毛利率环比大幅回升至38.2%,明显好于指引预期(34.1%)。上季度毛利率的“闪崩”,主要是受非经营性费用影响。

1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4