Boston Dynamic波士頓動力人形機器人Atlas全面升級,邁向自主智能的階段

Boston Dynamic波士頓動力人形機器人Atlas全面升級,邁向自主智能的階段

發布日期:

狂呼科技 Convo Tech 科技 Tech


要點:
隨著人工智能和機器人技術飛速進步,波士頓動力公司通過升級人形機器人Atlas的感知系統,實現了機器人在複雜環境中自主感知與靈活應變的關鍵突破。

隨著人工智能AI與機器人技術的快速發展,“自主性”已成為衡量新一代機器人實用價值的關鍵指標。過去,機器人往往依賴精確預編程完成單一任務,難以應對現實世界中瞬息萬變的環境與突發狀況。然而,若機器人能像人類一樣,主動感知環境、即時調整策略、靈活處理未預期的挑戰,便可真正走出實驗室,進入工廠、倉儲乃至日常生活之中。

波士頓動力公司/Boston Dynamic針對其人形機器人Atlas的感知系統所進行的重大升級,搭載了全新的感知系統,象徵著機器人技術向自主智能邁出關鍵一步。升級後的Atlas不僅能更精確地掌握周遭環境,還具備在工廠等複雜工業場景中獨立完成任務的能力。雖然其靈活動作早已廣受矚目,該公司此次更強調感知能力在實現機器人自主作業中的核心地位。

Boston Dynamic Atlas升級全感知系統

波士頓動力公司在一段雖然敘述簡略但內容豐富的影片中,展示了Atlas如何因應現場環境的持續變化。雖然任務本身看似僅是分類汽車零件,但影片背後的重點在於:開發團隊正致力於讓Atlas不僅能完成預設操作,更能靈活調整策略、主動應對突發情況。

影片中,有員工刻意改變零件架的位置,測試機器人的適應能力。Atlas必須在動態變化的空間中重新評估任務參數,並迅速做出調整。又如另一場景,一個零件被不慎掉落並發出聲響,Atlas雖無法根據聲音進行精準定位,卻能藉由視覺掃描鎖定目標並成功完成拾取與歸位,顯示出其視覺系統與推理能力的進步。

這段展示也深刻體現了莫拉維克悖論:對人類而言簡單的感知與動作協調,對機器人卻極為複雜。而人類難以處理的大量計算,反而是機器的強項。正因如此,Atlas的開發重點之一,是讓其感知系統具備高度靈活性與誤差容忍度。

舉例而言,若零件架的邊距只有五公分,哪怕抓取時偏移一公分,都可能導致任務失敗。因此Atlas必須能在操作過程中即時調整動作,甚至在發生錯誤後,自主進行修正。

而這些能力背後,依賴的是由多個高階技術構成的感知架構:包括高度校準的視覺與運動整合系統、最先進的機器學習模型,以及精確的狀態估計機制。每一個步驟,從辨識物體、判斷其位置與姿態、決定操作策略,到最終精準放置物件,都需仰賴深度的環境理解與即時反應能力。

實際應用中,像Atlas這樣的機器人需在充滿反光、昏暗或擁擠物體的環境中運作,要成功抓取並準確擺放一個零件,其實仰賴的是高度的感知推理能力。針對這些挑戰,波士頓動力開發了一套融合2D與3D感知技術的視覺系統,搭配物體姿態追蹤與視覺-動作的精密校準機制,使Atlas能更靈活、準確地理解與操作現實世界。

2D物件辨識與關鍵點預測技術

感知系統的首要任務,是判斷機器人周遭的環境狀況,例如是否存在障礙物?有哪些目標物件?地面是否潛藏風險?為此,波士頓動力運用2D物體偵測系統,以物件的類別、邊界框與關鍵點等資訊,提供環境的初步解析。

在這項應用中,Atlas必須辨識工廠中用來存放汽車零件的各式大型貨架裝置。這些固定裝置形狀與尺寸各異,機器人需要明確掌握它們的類型與佔據空間,才能有效規避碰撞風險。除了辨識各種貨架外,Atlas還會將它們的角落視為關鍵點,使感知資料能與已知模型準確對齊。

這些固定裝置的關鍵點以2D像素座標呈現,分為兩種類型:外部關鍵點(綠色)和內部關鍵點(紅色)。前者描繪貨架外部的包絡輪廓,例如正面四個角落。後者則更具細節性,對應於貨架內部的架構與小型隔間,幫助系統精準對位每一個物件槽位。

為實現即時的分類與關鍵點預測,Atlas採用一種輕量化的神經網絡架構,在效能與即時反應之間取得最佳平衡。這種設計對於機器人在變化多端的環境中保持靈活性與穩定性至關重要。

利用3D感知應該如何與物體互動

除了以上,為了準確操控固定裝置內的物體,Atlas必須首先判斷自身相對於這些裝置的位置與方向。為此,它運用一套基於關鍵點的定位模組,能夠針對周圍所有貨架裝置進行相對定位與姿態估算。

這個定位系統從物體偵測流程中提取出固定裝置的內外關鍵點,並透過最小化重投影誤差,將這些觀察點與預先建立的空間模型對齊。同時,系統整合了Atlas的運動里程資訊,藉由跨時間的幀一致性,進一步提升關鍵點預測的穩定性與準確度。

在實務操作中,一大挑戰是處理視野受限與關鍵點遮蔽的情況。例如,當Atlas靠近貨架時,部分外部關鍵點可能完全被遮擋;在角度偏斜的視角下,距離較遠的點也變得不可靠。為克服這些限制,系統會大量觀察來自裝置內部、如插槽隔間之間角落等豐富的關鍵點,這些位置與實際的抓取或放置行為密切相關。

這同時也引入另一個挑戰:如何將影像中的二維關鍵點對應到三維空間中的實體角點?Atlas首先利用外部關鍵點估算裝置的大致姿態,再據此推斷內部關鍵點的可能對應關係。內外資訊的結合,則有助於建構出整體裝置與各插槽更為可靠的三維定位結果。

此外,許多固定裝置在外觀上極為相似,這類裝置類在工廠環境中十分常見,也帶來額外的辨識難題。為解決這一點,Atlas融合了時間一致性以及空間先驗知識,例如裝置A位於裝置B的右側50公分處,以此強化辨識的區分能力。

這一整套機制構成了Atlas靈活且穩定的固定裝置感知系統。從影片中可見,當某人悄悄移動Atlas身後的裝置時,機器人能迅速察覺預期與現況的偏差,並立即重新定位該裝置,進而調整行動策略,展現出高度的自主反應能力。

Atlas之所以具備靈活高效的物體操作能力,關鍵在於其快速而精準的以物體為核心的感知系統。這項能力依賴於Atlas的物體姿態追蹤系統SuperTracker,它融合來自運動學、視覺與必要時的力覺等多源資訊,以實現穩定追蹤。

Atlas可透過其關節編碼器提供的運動學資料,精準得知自身夾持器的位置。當其判定已成功抓取物體時,該資訊可作為物體在移動過程中應處位置的強大先驗,有效應對因遮蔽或物體超出視野所帶來的視覺資訊缺失;若物體自手中滑脫,系統亦能即時做出警示。

在物體處於攝影機可視範圍時,Atlas會啟用姿勢估計模型,透過影像渲染與比較的方式,從單目影像中估算物體姿態。該模型經由大量合成資料訓練,能依據CAD模型將零樣本學習推廣至全新物件。初始化姿勢可基於3D先驗或2D區域資訊(如物體遮罩),隨後產生多組假設並由評分模型篩選最佳擬合值,進一步細化輸出。此模型已在我們內部數百種具CAD與紋理資料的工廠資產上證實其穩定性與通用性。

SuperTracker將視覺姿態估計作為三維空間中的初步參考,並搭配一系列驗證與濾波程序來提升可靠性,特別是在面對遮蔽、部分可見或光線變化等挑戰時:

自我一致性驗證 - 從多個擾動初始化出發,並採用最大團共識演算法,確認所有預測收斂至一致的姿態。

運動一致性驗證 - 排除任何導致Atlas手指與物體距離異常大的姿勢,作為物理接觸的合理代理。

非同步數據整合 - 利用固定滯後平滑器處理高速的運動學數據與較低頻率的視覺輸出,最終產生準確的6自由度物體軌跡。

執行如分類、插放等精細操作時,手眼協調的精準性至關重要。這意味著Atlas的視覺感知必須與其動作控制緊密對齊。上這樣的精度來自於一套嚴謹的攝影機與運動系統校準機制,能有效補償製造與組裝中的誤差,以及長期運作下因熱變形或反覆撞擊所產生的結構偏差。我們的經驗表明,精準的手眼校準是高性能操控與自主感知的根本條件。

但這一切仍只是起點。波士頓動力的最終目標是打造真正敏捷且具備自我調整能力的系統,這不僅需要空間上的智慧,也需要理解運動的幾何、語義與物理規律。目前,該公司正致力於為Atlas建構一個統一的基礎模型架構。未來,感知與行動將不再是分離的模組,而是緊密交融的整體,讓Atlas從空間智能邁向真正的運動智能。

這一切的發展不僅是技術突破的體現,更標誌著人機關係的一次深刻轉變。在過去,機器人僅是人類指令的延伸,但如今,像Atlas這樣的系統正逐步具備主動理解環境、預判情境、並靈活應對的能力。當機器人不再只是工具,而成為能與人類協作、共享任務責任的智能體時,我們也將重新定義什麼是“智能”與“體力”的界線。Atlas的進化,不只是科技的勝利,更是我們對未來生活方式的一次預演,一個人機共生、靈活應變、智能協作的新時代正悄然展開。

狂呼科技 Convo Tech

科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。

狂呼科技,研究,聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。

狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回網誌
  • 對話前OpenAI科學家:GPT-5能獲得奧賽金牌,但那可能具有欺騙性? | 播客Podcast

    對話前OpenAI科學家:GPT-5能獲得奧賽金牌,但那可能具有欺騙性? | 播客Podcast

    對話 OpenAI 的兩位前科學家:Kenneth Stanley和Joel Lehman;他們曾親歷前ChatGPT 時代的OpenAI,也是《為什麼偉大不能被計劃》一書的作者。2023 年,這本書曾在中國科技圈掀起閱讀的趨勢。那正是ChatGPT 席捲全球、掀開大模型浪潮的一年。

    對話前OpenAI科學家:GPT-5能獲得奧賽金牌,但那可能具有欺騙性? | 播客Podcast

    對話 OpenAI 的兩位前科學家:Kenneth Stanley和Joel Lehman;他們曾親歷前ChatGPT 時代的OpenAI,也是《為什麼偉大不能被計劃》一書的作者。2023 年,這本書曾在中國科技圈掀起閱讀的趨勢。那正是ChatGPT 席捲全球、掀開大模型浪潮的一年。

  • BABA最新財報,阿里雲增長和利潤率雙提升

    BABA最新財報,阿里雲增長和利潤率雙提升

    BABA 最新一季業績,整體來看雖因外賣大戰導致的虧損同樣比預期要高,但相比京東、美團兩家的利潤清空,明顯要好。且除此之外幾乎沒有缺點,CMR 保持不俗增長,阿里雲增長和利潤率雙提升,國際電商板塊也超預期近乎扭虧,整體來看無疑不錯。

    BABA最新財報,阿里雲增長和利潤率雙提升

    BABA 最新一季業績,整體來看雖因外賣大戰導致的虧損同樣比預期要高,但相比京東、美團兩家的利潤清空,明顯要好。且除此之外幾乎沒有缺點,CMR 保持不俗增長,阿里雲增長和利潤率雙提升,國際電商板塊也超預期近乎扭虧,整體來看無疑不錯。

  • NVDA英偉達財報整體符合預期

    NVDA英偉達財報整體符合預期

    NVDA 本季度計算收入 338.4 億美元,網絡業務收入 72.5 億美元。其中本季度計算收入環比增長有所放緩,主要受 H20 被禁售向中國的影響。由於下游部分客户更加期待後續量產的 GB300 產品,各家也陸續調高了下半年的資本開支。

    NVDA英偉達財報整體符合預期

    NVDA 本季度計算收入 338.4 億美元,網絡業務收入 72.5 億美元。其中本季度計算收入環比增長有所放緩,主要受 H20 被禁售向中國的影響。由於下游部分客户更加期待後續量產的 GB300 產品,各家也陸續調高了下半年的資本開支。

  • BILI嗶哩嗶哩2025年二季度財報,整體收入基本符合指引

    BILI嗶哩嗶哩2025年二季度財報,整體收入基本符合指引

    BILI利潤超預期,這次亮點仍然是盈利端,明顯超市場預期,但主要是營銷費用較低帶來。二季度雖然沒新遊本身營銷費用理應不多,但《三謀》有周年慶活動,年初幾次賽季更新變動也不小,因此也並非完全不需要額外的營銷。

    BILI嗶哩嗶哩2025年二季度財報,整體收入基本符合指引

    BILI利潤超預期,這次亮點仍然是盈利端,明顯超市場預期,但主要是營銷費用較低帶來。二季度雖然沒新遊本身營銷費用理應不多,但《三謀》有周年慶活動,年初幾次賽季更新變動也不小,因此也並非完全不需要額外的營銷。

  • BIDU百度二季度業績略超預期

    BIDU百度二季度業績略超預期

    百度智慧雲預期中高增長:雲業務在當下是風口,高增長自然沒得説。不過少了上季度的驚豔,二季度的 27% 增長符合市場大部分預期,利好早已經打入估值。廣告陷痛苦轉型期:轉型的陣痛開始變得醒目,目前搜索結果中 AI 生成內容的滲透率已經提高至 64%。

    BIDU百度二季度業績略超預期

    百度智慧雲預期中高增長:雲業務在當下是風口,高增長自然沒得説。不過少了上季度的驚豔,二季度的 27% 增長符合市場大部分預期,利好早已經打入估值。廣告陷痛苦轉型期:轉型的陣痛開始變得醒目,目前搜索結果中 AI 生成內容的滲透率已經提高至 64%。

  • LABUBU泡泡瑪特2025年H1業績,利潤均超過了去年全年水平

    LABUBU泡泡瑪特2025年H1業績,利潤均超過了去年全年水平

    THE MONSTERS 系列目前作為泡泡瑪特的第一大 IP,經過近一年的 “狂飆”,目前銷售佔比已經接近 35%,這還是在公司主動控貨的情況下。這意味着明年在高基數的情況下,如果消費者對 LABUBU 產生審美疲勞,對泡泡瑪特整體的業績衝擊會比較大。

    LABUBU泡泡瑪特2025年H1業績,利潤均超過了去年全年水平

    THE MONSTERS 系列目前作為泡泡瑪特的第一大 IP,經過近一年的 “狂飆”,目前銷售佔比已經接近 35%,這還是在公司主動控貨的情況下。這意味着明年在高基數的情況下,如果消費者對 LABUBU 產生審美疲勞,對泡泡瑪特整體的業績衝擊會比較大。

  • 小米2025年第二季度財報,汽車業務毛利率繼續提升!

    小米2025年第二季度財報,汽車業務毛利率繼續提升!

    小米公司本季度汽車出貨量 8.1 萬台,單車均價進一步提升至 25.3 萬元。主要是受 Ultra 車型等高價車型出貨,結構性帶動均價提升。本季度汽車業務毛利率繼續提升至 26.4%,再超市場預期 23.5%,主要是受均價提升和規模效應的帶動。

    小米2025年第二季度財報,汽車業務毛利率繼續提升!

    小米公司本季度汽車出貨量 8.1 萬台,單車均價進一步提升至 25.3 萬元。主要是受 Ultra 車型等高價車型出貨,結構性帶動均價提升。本季度汽車業務毛利率繼續提升至 26.4%,再超市場預期 23.5%,主要是受均價提升和規模效應的帶動。

  • 本周資本市場推測9月降息的聲音越來越響亮

    本周資本市場推測9月降息的聲音越來越響亮

    降息之路並非一帆風順。市場時而充滿期待,時而又因聯準會未如預期行動而感到失望。然而,專家們仍認為利率走勢有望保持在相對低位。隨著通膨持續疲弱、勞動市場壓力逐步顯現,風險平衡正加速傾向降息。

    本周資本市場推測9月降息的聲音越來越響亮

    降息之路並非一帆風順。市場時而充滿期待,時而又因聯準會未如預期行動而感到失望。然而,專家們仍認為利率走勢有望保持在相對低位。隨著通膨持續疲弱、勞動市場壓力逐步顯現,風險平衡正加速傾向降息。

1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

1 / 4