Sharpa機器人削蘋果

Sharpa機器人削蘋果

發布日期:

狂呼科技 Convo Tech 科技 Tech


要點:
對人類來說,削蘋果是件輕而易舉的晨間小事,但對機器人而言,這是雙手協調能力的「終極挑戰」。

削蘋果需要一隻手保持穩定的抓握並旋轉蘋果,另一隻手則要精準地控製刀片的力度——同時還要不斷處理觸覺反饋,以防止蘋果滑落或刀片削得太深。

Sharpa夏帕機器人公司發布了一項研究,詳細闡述瞭如何彌補這一差距。該公司將名為MoDE-VLA的新型人工智慧架構與共享自主「副駕駛」系統相結合,展示了其聲稱的首個自主雙靈巧手蘋果削皮序列。這項突破性進展推動了視覺-語言-動作(VLA)模型的發展,該模型以往僅限於使用低自由度機械手臂執行簡單的「抓取和放置」任務。

在機器人操作領域,視覺-語言-動作(VLA)模型取得了令人矚目的進步。我們已經看到機器人能夠輕鬆地拾取玩具和整理衣物。然而,這些成功大多局限於使用基本平行爪夾持器的簡單「抓取和放置」任務。

對於 類似人類的雙手靈巧操作——例如削蘋果皮這類需要不斷手部旋轉和精確力度控制的任務——傳統的 VLA 模型經常會遇到瓶頸。

一篇題為「透過強化學習增強遠端操作和混合靈巧專家虛擬雷射輔助系統實現類人操作」的新研究論文提出了一個突破性的框架來解決這個問題。該團隊將用於複雜手指動作的「副駕駛」與用於感覺融合的新型「混合專家」架構相結合,實現了可能是首個自主雙靈巧手削蘋果的操作。

挑戰:為什麼蘋果要削皮這麼難?

削蘋果皮不只是揮動刀子那麼簡單,它需要一系列動作的配合:

  1. 資料瓶頸:遠端操控兩隻總共有63 個自由度 (DoF) 的手對於人類操作員來說簡直是一場噩夢。
  2. 多元技能學習:機器人必須在視覺引導的抓取、力量引導的切割和觸覺引導的手內旋轉之間進行轉換。
  3. 模態異質性:簡單地將力和觸覺資料「插入」到用影像訓練的模型中,往往會使機器人感到困惑,而不是幫助它。

解決方案:雙管齊下的框架

研究人員透過兩個協同組件解決了這些瓶頸問題:IMCopilotMoDE-VLA

1. IMCopilot:您的掌上操控助手
訓練機器人進行類似人類的操作,最大的障礙在於資料。人類可以輕鬆遠端操控簡單的機械爪,但要控制夏普公司(Sharpa)的夏普北( SharpaNorth )機器人(配備兩隻夏普波機械手)的63個自由度,即使對經驗豐富的操作員來說,也是一項認知負荷巨大的任務。

為了解決這個問題,夏帕公司推出了IMCopilot(手部操作輔助系統)。在資料擷取階段,系統以共享自主模式運作:操作員使用外骨骼控制機器手臂的「粗略」運動,但透過腳踏板將「精細」的手部旋轉操作委託給人工智慧。

IMCopilot(手部操作輔助系統)是一套透過強化學習(RL)訓練的原子技能。它具有雙重作用:

  • 資料採集期間:它充當共享自主助手。操作人員透過外骨骼控制「大」臂的運動,同時透過腳踏板觸發 IMCopilot 來處理蘋果複雜的手持旋轉動作。
  • 執行過程中:它成為主 VLA 模型在需要旋轉或穩定物體時可以呼叫的「低階技能」。

2. ModE-VLA:靈巧專家混合模型

為了應對力和觸覺數據的“感官過載”,該團隊開發了MoDE-VLA。與將所有數據一視同仁的傳統模型不同,MoDE-VLA 採用混合專家 (MoE)方法:

  • 專用路徑:力(手臂扭力)和觸覺(指尖壓力)資料與視覺資料分開處理。
  • 稀疏路由:此模型動態地將資訊「路由」給各領域的專家。例如,當削皮器接觸到蘋果皮的瞬間,它可能會立即啟動一位「接觸發病率專家」。
  • 殘餘注入:這些專家不會涵蓋機器人已有的知識;他們會根據即時觸控提供「修正」或改進操作。

它真的有效嗎?

結果不言而喻。研究人員在四項難度遞增的任務上測試了這個框架:齒輪組裝、充電器插拔、管子重新排列和蘋果削皮。

  • 更高的成功率:在接觸豐富的任務中,MoDE-VLA 的成功率比基準模型高出一倍。
  • 蘋果測試:在蘋果剝皮的終極測試中,該框架實現了73% 的剝皮完成率,成功執行了重複的剝皮和旋轉循環。
  • 精準度:在諸如插拔充電器這類任務中,幾毫米的誤差就會造成影響,而這些經過專業訓練的專家提供了必要的“配合”,從而在僅憑視覺的模型無法完成的任務中取得了成功。

SharpaWave的優勢

SharpaWave 22自由度靈巧手憑藉其整合的感測功能和分層控制框架在執行高精度、高接觸操作方面表現出色。其主要優點在於將來自十個指尖的6自由度力回饋和觸覺回饋與視覺-語言-動作(VLA)主幹系統無縫融合,使機器人能夠在諸如齒輪組裝和蘋果削皮等精細任務中檢測到細微的接觸狀態,例如滑動或阻力。 

透過使用IMCopilot套件,SharpaWave 可以將複雜的低級手指協調(特別是手內物體旋轉)委託給經過強化學習訓練的原子技能,從而顯著克服了傳統遠程操作的“數據採集瓶頸”,並使操控蘋果等複雜物體的成功率達到 93%。最終,該機械手在MoDE-VLA演算法下的運行能力實現了“接觸感知優化”,即專家可以根據物理交互動態調整動作,使靈巧任務的成功率比標準基線提高了一倍。

這項研究使我們離不僅能「看到」世界,還能「感受到」世界的機器人又更近了一步。透過將複雜、高頻的手指運動委託給專門的“副駕駛”,並利用專家來解讀觸覺,雖然蘋果削皮的成功率只有 30%,還有提升的空間,但「削皮完成率」達到了 73%,這表明即使機器人無法每次都成功完成任務,它也能持續完成複雜的序列。Sharpa正在為能夠像人類一樣靈巧地完成複雜家務和工業裝配的機器人鋪平道路。

狂呼科技 Convo Tech

科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。

狂呼科技,研究,聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。

狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回網誌
  • ORCL業績整體表現算是中性,功過相抵。

    ORCL業績整體表現算是中性,功過相抵。

    ORCL 甲骨文剔除 OCI 業務 -- 即 IaaS 雲業務外,剩下的所有傳統業務都已完全沒有成長性,長期營收增速都只徘徊在零上下、好也不過個位數增長。且在當下,和其他軟件公司一樣,這部分傳統業務也存在被 AI 顛覆的風險。

    ORCL業績整體表現算是中性,功過相抵。

    ORCL 甲骨文剔除 OCI 業務 -- 即 IaaS 雲業務外,剩下的所有傳統業務都已完全沒有成長性,長期營收增速都只徘徊在零上下、好也不過個位數增長。且在當下,和其他軟件公司一樣,這部分傳統業務也存在被 AI 顛覆的風險。

  • Nvidia開源AI代理平台NemoClaw重新定義企業級人工智慧代理!

    Nvidia開源AI代理平台NemoClaw重新定義企業級人工智慧代理!

    NemoClaw 是 NVIDIA 即將推出的開源 AI 代理平台,旨在為企業提供安全、可控且高效的 AI 代理部署環境。它與 NVIDIA NeMo 框架和 NIM(NVIDIA 推理微服務)深度集成,使企業能夠在嚴格遵守資料治理的同時,充分利用 GPU 加速的 AI 代理功能。

    Nvidia開源AI代理平台NemoClaw重新定義企業級人工智慧代理!

    NemoClaw 是 NVIDIA 即將推出的開源 AI 代理平台,旨在為企業提供安全、可控且高效的 AI 代理部署環境。它與 NVIDIA NeMo 框架和 NIM(NVIDIA 推理微服務)深度集成,使企業能夠在嚴格遵守資料治理的同時,充分利用 GPU 加速的 AI 代理功能。

  • NVIDIA和Thinking Machines Lab建立長期千兆瓦級策略合作

    NVIDIA和Thinking Machines Lab建立長期千兆瓦級策略合作

    NVIDIA 和 Thinking Machines Lab 今天宣布達成一項多年戰略合作,將部署至少 1 吉瓦 的下一代 NVIDIA Vera Rubin 系統,以支援 Thinking Machines 的前沿模型訓練和平台,從而大規模地提供可自訂的 AI 服務。

    NVIDIA和Thinking Machines Lab建立長期千兆瓦級策略合作

    NVIDIA 和 Thinking Machines Lab 今天宣布達成一項多年戰略合作,將部署至少 1 吉瓦 的下一代 NVIDIA Vera Rubin 系統,以支援 Thinking Machines 的前沿模型訓練和平台,從而大規模地提供可自訂的 AI 服務。

  • COST財報,營收同比增長 9.2%!

    COST財報,營收同比增長 9.2%!

    COST 整體業績上,本季總營收同比增長 9.2%,較上季度的 8.3% 有不小提速,主要是受匯率利好和客單價走高的利好。而經營利潤為 26.1 億,同比增長 12.5%。利潤率同比小幅提高 0.1pct,仍在提升趨勢內,但改善幅度低於預期的 0.2pct。

    COST財報,營收同比增長 9.2%!

    COST 整體業績上,本季總營收同比增長 9.2%,較上季度的 8.3% 有不小提速,主要是受匯率利好和客單價走高的利好。而經營利潤為 26.1 億,同比增長 12.5%。利潤率同比小幅提高 0.1pct,仍在提升趨勢內,但改善幅度低於預期的 0.2pct。

  • NVDA英偉達2026財年第四季度財報,利潤端持續向好!

    NVDA英偉達2026財年第四季度財報,利潤端持續向好!

    NVDA英偉達本次財報數據依然是相當不錯的,其中收入端本季度環比增長 111 億美元,基本都來自於數據中心業務中 Blackwell 系列量產增加的帶動,公司毛利率也重新回到了 75%。對於下季度指引,公司預計收入端將繼續提升至 780 億美元。

    NVDA英偉達2026財年第四季度財報,利潤端持續向好!

    NVDA英偉達本次財報數據依然是相當不錯的,其中收入端本季度環比增長 111 億美元,基本都來自於數據中心業務中 Blackwell 系列量產增加的帶動,公司毛利率也重新回到了 75%。對於下季度指引,公司預計收入端將繼續提升至 780 億美元。

  • 從傳奇到威脅:Anthropic AI如何破解COBOL現代化僵局,並引發IBM股價巨震

    從傳奇到威脅:Anthropic AI如何破解COBOL現代化僵局,並引發IBM股價巨震

    今日,科技界與華爾街同時感受到了一場強震。人工智慧領先企業 Anthropic 正式發佈了專為 COBOL 現代化設計的 Claude Code 工具與實戰手冊。這項消息發布後,全球科技服務巨頭 IBM 的股價在盤中應聲重挫近 10%。

    從傳奇到威脅:Anthropic AI如何破解COBOL現代化僵局,並引發IBM股價巨震

    今日,科技界與華爾街同時感受到了一場強震。人工智慧領先企業 Anthropic 正式發佈了專為 COBOL 現代化設計的 Claude Code 工具與實戰手冊。這項消息發布後,全球科技服務巨頭 IBM 的股價在盤中應聲重挫近 10%。

  • 美國最高法院裁定川普全球關稅違憲!

    美國最高法院裁定川普全球關稅違憲!

    2月20日,美國最高法院以6比3的投票結果推翻了美國政府在全球徵收的大規模關稅。法院裁定,總統援引《國際緊急經濟權力法》(IEEPA)在全球範圍內徵收關稅屬於越權行為。法院並未就進口商有權獲得退稅的程度作出裁決,而是將此項決定留給了下級法院。

    美國最高法院裁定川普全球關稅違憲!

    2月20日,美國最高法院以6比3的投票結果推翻了美國政府在全球徵收的大規模關稅。法院裁定,總統援引《國際緊急經濟權力法》(IEEPA)在全球範圍內徵收關稅屬於越權行為。法院並未就進口商有權獲得退稅的程度作出裁決,而是將此項決定留給了下級法院。

  • AMZN亞馬遜財報,AWS如期明顯提速

    AMZN亞馬遜財報,AWS如期明顯提速

    AMZN自研芯片也大體解決了獲取 GPU 的劣勢,市場對 AWS 後續的增長前景是非常樂觀的。結合公司披露,AWS 會是未來 2 年內,新增算力供應最多的雲服務商。按此前到 27 年算力翻倍的指引,預期未來 2 年 AWS 會合計新增約 10 GW 算力。

    AMZN亞馬遜財報,AWS如期明顯提速

    AMZN自研芯片也大體解決了獲取 GPU 的劣勢,市場對 AWS 後續的增長前景是非常樂觀的。結合公司披露,AWS 會是未來 2 年內,新增算力供應最多的雲服務商。按此前到 27 年算力翻倍的指引,預期未來 2 年 AWS 會合計新增約 10 GW 算力。

1 / 8
  • Sharpa機器人削蘋果

    Sharpa機器人削蘋果

    對人類來說,削蘋果是件輕而易舉的晨間小事,但對機器人而言,這是雙手協調能力的「終極挑戰」。Sharpa機器人正在為能夠像人類一樣靈巧地完成複雜家務和工業裝配的機器人鋪平道路。

    Sharpa機器人削蘋果

    對人類來說,削蘋果是件輕而易舉的晨間小事,但對機器人而言,這是雙手協調能力的「終極挑戰」。Sharpa機器人正在為能夠像人類一樣靈巧地完成複雜家務和工業裝配的機器人鋪平道路。

  • 腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    近期,中國科學家在“Cell”雜志上發表的一項突破性研究,為這一頑疾提供了全新思路。他們利用基因編輯技朮,將癌細胞改造成免疫系統眼中的“異類”,類似於人體對豬器官產生的超急性排斥反應,從而引發了一場針對癌細胞的精准“免疫殲滅戰”。

    腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    近期,中國科學家在“Cell”雜志上發表的一項突破性研究,為這一頑疾提供了全新思路。他們利用基因編輯技朮,將癌細胞改造成免疫系統眼中的“異類”,類似於人體對豬器官產生的超急性排斥反應,從而引發了一場針對癌細胞的精准“免疫殲滅戰”。

  • 新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新系統的核心原理與常見的“嘗試說話”型腦機介面相似,都是在大腦運動皮質植入感測器,這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型,模型依據個人化數據判斷信號對應的聲音,進而預測使用者想說的單字。

    新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新系統的核心原理與常見的“嘗試說話”型腦機介面相似,都是在大腦運動皮質植入感測器,這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型,模型依據個人化數據判斷信號對應的聲音,進而預測使用者想說的單字。

  • “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來,生物學家們一直在探討它們是否真的無用。如今的主流觀點認為,這些片段雖不直接參與蛋白質合成,卻在整體基因組中佔據了極大比例,顯示它們可能具有重要功能。

    “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來,生物學家們一直在探討它們是否真的無用。如今的主流觀點認為,這些片段雖不直接參與蛋白質合成,卻在整體基因組中佔據了極大比例,顯示它們可能具有重要功能。

1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

1 / 4