要点:
丰田研究院试图为机器人创建“大行为模型”/LBMs,创建“机器人幼儿园”,成功培训机器人获得了超过60项具有挑战性的技能。丰田研究院的研究人员在研发出现在的机器人行为模型后,还试图为机器人创建大型行为模型。机器人获得触觉提升技能学习速度,未来或能实现机器人自主拓展新技能。
科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。
狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。
狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。
联系我们// 相关文章
近日,丰田研究院/TRI利用生成式AI在一个“机器人幼儿园”中教机器人如何做早餐,或者至少是做早餐所需的各个任务。他们并不需要花费数百小时的编码和调试,而是通过给机器人一个触觉感知器,将它们接入一个人工智能AI模型,然后像教一个人类一样,向它们展示如何做。该机器人行为模型基于AI的扩散策略,可以在数十次新技能的演示后学习新技能。
运用该机器人行为模型,能让机器人产出一致性强、可重复和高性能的结果。而且机器人学习和产出的速度极快,不再需要人工来进行编码和修复编码错误,提高了机器人的实用性,也在构建机器人大型行为模型/LBMs方向上迈进了一步。
机器人也要“上学”?
据TOYOTA官网公告,以前,教机器人新行为的技术进展缓慢、效率较低,而且一般在执行任务时有很多限制性条件,所执行的任务也是非常具体和细节的。机器人专家需要花费大量时间编写复杂的代码,可能还要不断修改代码错误,以此为机器人添加新行为。
现在,有了机器人行为模型。研究员认为,触觉是这个机器人行为模型的关键要素。他们给机器人提供了一种大拇指般大小的触觉传感器,能够让机器人通过触觉来感知和学习,从而像人类一样更轻松地执行各种复杂任务。据相关资料显示,研究人员就曾在“机器人幼儿园”教机器人如何做早餐。
研究人员称,他们试图为机器人创建“大行为模型”/LBMs。类似于LLMs是通过注意人类写作中的模式来训练的,丰田的LBMs将通过观察来学习,然后“泛化”,执行它们从未被教过的新技能。使用这种方法,研究人员说他们已经训练了60多个具有挑战性的技能,如“倒液体、使用工具和操纵可变形物体”。
“机器人幼儿园”的运作方式是,首先由一位“老师”展示一套技能,然后机器人的模型在后台学习几个小时,最后机器人成功形成新的工作行为。丰田研究院的灵巧操纵实验室经理表示,他们经常是在下午教机器人,让它学习一晚上,第二天早上就可以来看到它的新行为了。
到目前为止,研究人员已经使用机器人行为模型,成功培训机器人获得了超过60项具有挑战性的技能,例如倒液体、使用工具以及操控可变形物体等。并且他们希望在2024年底前将这个数字增加到1000项。
机器人大型行为模型正在创建
丰田研究院的研究人员在研发出现在的机器人行为模型后,还试图为机器人创建大型行为模型。丰田研究院机器人研究副总裁Russ Tedrake表示,大型行为模型与大语言模型类似,是通过观察来学习,然后能执行从没有教过的新技能。
值得注意的是,Google和特斯拉也一直在对其Robotic Transformer RT-2进行类似的研究。与丰田公司研究人员的方法类似,他们的机器人也是利用自己的经验来推断如何做事。从理论上讲,经过人工智能训练的机器人最终可以在几乎没有任何指令的情况下执行任务,而只需要给人类一个大致的指示。从理论上讲,经过AI训练的机器人最终可以实现,只给出一个大致方向,而不需要任何具体的行动指令就可以完成任务,例如“清理那个溢出的东西”。
不过,但正如部分资料显示,这类机器人至少还有很长的路要走。这种工作通常是"缓慢和劳动密集型的",提供足够的训练数据比向人工智能模型提供大量从互联网上下载的数据要难得多。
但是,机器人获得触觉提升技能学习速度,未来或能实现机器人自主拓展新技能<br data-mce-fragment="1">丰田研究院的机器人行为模型让机器人获得了触觉,相比于从前训练机器人的人工编码和错误查找,新模型不仅减少了人力付出,也提高了机器人学习新技能的速度,让机器人能够帮助人们更快、更好地完成更多任务。
此外,丰田研究院研究人员称,他们正在构建机器人大型行为模型。有了现在的机器人行为模型的出现,在研究院与科技公司的探索下,未来机器人大型行为模型或许也有可能成为现实,机器人通过观察自主拓展新技能也有可能实现。