要點:
豐田研究院試圖為機器人創建“大行為模型”/LBMs,創建“機器人幼兒園”,成功培訓機器人獲得了超過60項具有挑戰性的技能。丰田研究院的研究人員在研發出現在的機器人行為模型后,還試圖為機器人創建大型行為模型。機器人獲得觸覺提升技能學習速度,未來或能實現機器人自主拓展新技能。
科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。
狂呼科技研究所聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。
狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。
聯系我們 // 相關文章
近日,丰田研究院/TRI利用生成式AI在一個“機器人幼兒園”中教機器人如何做早餐,或者至少是做早餐所需的各個任務。他們并不需要花費數百小時的編碼和調試,而是通過給機器人一個觸覺感知器,將它們接入一個人工智能AI模型,然后像教一個人類一樣,向它們展示如何做。該機器人行為模型基於AI的擴散策略,可以在數十次新技能的演示后學習新技能。
運用該機器人行為模型,能讓機器人產出一致性強、可重復和高性能的結果。而且機器人學習和產出的速度極快,不再需要人工來進行編碼和修復編碼錯誤,提高了機器人的實用性,也在搆建機器人大型行為模型/LBMs方向上邁進了一步。
機器人也要“上學”?
據TOYOTA官網公告,以前,教機器人新行為的技朮進展緩慢、效率較低,而且一般在執行任務時有很多限制性條件,所執行的任務也是非常具體和細節的。機器人專家需要花費大量時間編寫復雜的代碼,可能還要不斷修改代碼錯誤,以此為機器人添加新行為。
現在,有了機器人行為模型。研究員認為,觸覺是這個機器人行為模型的關鍵要素。他們給機器人提供了一種大拇指般大小的觸覺傳感器,能夠讓機器人通過觸覺來感知和學習,從而像人類一樣更輕松地執行各種復雜任務。據相關資料顯示,研究人員就曾在“機器人幼兒園”教機器人如何做早餐。
研究人員稱,他們試圖為機器人創建“大行為模型”/LBMs。類似於LLMs是通過注意人類寫作中的模式來訓練的,丰田的LBMs將通過觀察來學習,然后“泛化”,執行它們從未被教過的新技能。使用這種方法,研究人員說他們已經訓練了60多個具有挑戰性的技能,如“倒液體、使用工具和操縱可變形物體”。
“機器人幼兒園”的運作方式是,首先由一位“老師”展示一套技能,然后機器人的模型在后台學習几個小時,最后機器人成功形成新的工作行為。丰田研究院的靈巧操縱實驗室經理表示,他們經常是在下午教機器人,讓它學習一晚上,第二天早上就可以來看到它的新行為了。
到目前為止,研究人員已經使用機器人行為模型,成功培訓機器人獲得了超過60項具有挑戰性的技能,例如倒液體、使用工具以及操控可變形物體等。并且他們希望在2024年底前將這個數字增加到1000項。
機器人大型行為模型正在創建
丰田研究院的研究人員在研發出現在的機器人行為模型后,還試圖為機器人創建大型行為模型。丰田研究院機器人研究副總裁Russ Tedrake表示,大型行為模型與大語言模型類似,是通過觀察來學習,然后能執行從沒有教過的新技能。
值得註意的是,Google和特斯拉也一直在對其Robotic Transformer RT-2進行類似的研究。與丰田公司研究人員的方法類似,他們的機器人也是利用自己的經驗來推斷如何做事。從理論上講,經過人工智能訓練的機器人最終可以在几乎沒有任何指令的情況下執行任務,而只需要給人類一個大致的指示。從理論上講,經過AI訓練的機器人最終可以實現,只給出一個大致方向,而不需要任何具體的行動指令就可以完成任務,例如“清理那個溢出的東西”。
不過,但正如部分資料顯示,這類機器人至少還有很長的路要走。這種工作通常是"緩慢和勞動密集型的",提供足夠的訓練數據比向人工智能模型提供大量從互聯網上下載的數據要難得多。
但是,機器人獲得觸覺提升技能學習速度,未來或能實現機器人自主拓展新技能
豐田研究院的機器人行為模型讓機器人獲得了觸覺,相比於從前訓練機器人的人工編碼和錯誤查找,新模型不僅減少了人力付出,也提高了機器人學習新技能的速度,讓機器人能夠幫助人們更快、更好地完成更多任務。
此外,丰田研究院研究人員稱,他們正在搆建機器人大型行為模型。有了現在的機器人行為模型的出現,在研究院與科技公司的探索下,未來機器人大型行為模型或許也有可能成為現實,機器人通過觀察自主拓展新技能也有可能實現。