中國科學家發布通才智能體完全解鎖《我的世界》,像人類一樣生存,探索和創造!

中国科学家发布通才智能体完全解锁《我的世界》,像人类一样生存,探索和创造!

發布日期:

科技 Tech


要点:
一个理想的AI应该具有与人类类似的能力。游戏“我的世界”里的AI不管是根据其当前的技能水平和世界状态提出合适的任务、根据环境反馈完善技能并将掌握的技能存入记忆,还是不断探索世界,以自驱动的方式寻找新任务,其实都已经和现实世界中人类的决策过程和行为方式非常相近。

致力于传播优质的中国知识内容、构建全球新共识。我们将通过一系列时事资讯、精品课程、论坛、节目、咨询报告等内容产品,提供关于当代中国的最新的舆论思潮、深入的社会观察、亮眼的科技成就等优质信息。我们已与五大洲十多个国家、百余个研究机构、媒体机构、政治团体、民间组织建立合作关系。希望通过我们的工作在海外分享中国经验,讲述中国故事,客观分析我们共同面对的挑战和机遇,携手全球青年寻找全球化发展的新共识。
联系我们// Substack // Twitter // YouTube // 相关文章

你是否喜欢在“Minecraft”广阔多样的世界中冒险,挖掘资源,制造工具和建造建筑物?你是否想要一个伙伴来和你一起探险?清华大学和中国科学院的研究人员开发了一个新的AI智能体,可以陪伴你完成任务。他们称之为Minecraft中的幽灵/Ghost in Minecraft, 简称GITM,它不是你平常见到的普通机器人。

Minecraft中的AI智能体们却面临着一种有趣的莫拉维克悖论:对于人类来说具有挑战性的任务,如下棋对于AI来说相对简单,而对于人类来说通常很容易的任务(如在像Minecraft这样的开放世界环境中进行互动和决策)却对AI来说是巨大的挑战。

via GIPHY

GITM成功地克服了这个悖论,在一个复杂、逼真的环境中取得了重大突破。这对AI技术的潜在进步和更通用的AI智能体的开发做出了巨大贡献。

GITM是一个通用智能体/Generally Capable Agent, 简称GCA,意味着它可以处理任何任务而不需要特定的培训或指令。它使用大型语言模型/Large Language Model,简称LLM实现这种能力,这基本上意味着它拥有对单词和常识的广泛理解。 GITM通过自然语言与你交流,并理解你的预期结果。此外,它使用基于文本的知识和记忆来存储和检索有用的信息,例如配方、位置和目标。


GITM 在Minecraft 主世界的所有技术挑战中实现了100% 的任务覆盖率(成功解锁了完整的技术树),而之前所有智能加起来只能覆盖30%。

研究人员在Minecraft中的一个流行任务“获取钻石”上测试了GITM,其任务是找到并挖掘一颗钻石。这不是一个容易的任务,因为钻石很少,而且在地下很深处,智能体还必须在途中生存各种危险,如熔岩、怪物和饥饿。以前使用强化学习/RL的方法只能实现约20%的成功率,这意味着它们失败了5次中的4次。而GITM则取得了惊人的67.5%的成功率,这意味着它在3次尝试中成功了2次。这是一个巨大的改进!

但GITM并不满足于钻石。 GITM可以获得游戏中的所有物品,从木材到玉髓。它可以制造工具、武器和装甲,建造庇护所和农场,甚至驯服动物。它可以做任何你能做的事情,而且可能做得更好。

GITM是如何实现这一切的呢?它釆用了一种巧妙的方法。以前的AI智能体很难将Minecraft中的复杂目标与完成所需的精确鼠标和键槃操作联系起来。然而,GITM釆用LLM根据当前情况和期望目标生成行动计划。 LLM由三个组成部分组成:

LLM Decomposer:利用外部知识,如互联网上的游戏知识库,将复杂任务分解为简单的子任务。

LLM Planner:计为每个子任务制规划一系列的结构化动作,并根据反馈信息调整规划,还能通过不断总结成功经验提升自己

LLM Interface:使用底层的键槃鼠标操作执行结构化动作,并在与环境交互的过程中获取观察信息

例如,如果GITM想要制作地狱传送门,它可以询问LLM如何制作,LLM会告诉它类似于以下内容:
- 找一些黑曜石、燧石和钢
- 将黑曜石放在一个4x5的矩形中心有一个2x3的洞
- 用燧石和钢在底部的黑曜石块上点燃火
- 进入传送门

GITM可以逐步执行这些步骤,并使用基于文本的记忆来跟踪它已经做了什么和接下来需要做什么。它还可以使用基于文本的知识来查找任何需要的信息,例如配方、位置和物品属性。例如,如果GITM想知道在哪里找到黑曜石,它可以询问LLM,LLM会告诉它类似于以下内容:
- 黑曜石是一种稀有块,可以在熔岩池附近找到
- 它有一种深紫色的颜色,很硬
- 它可以用钻石镐或更好的工具开釆
- 它是当水遇到熔岩时形成的

GITM可以使用这些信息来指导它的探索和挖掘活动。值得注意的是,GITM不需要GPU进行训练;一个具有32个CPU核心的单个CPU节点就足够了。这意味着一个不错的笔记本电脑就足以运行GITM,相比于OpenAI的VPT和DeepMind的DreamerV3,它可以提高效率至少10,000倍。 你甚至可以从它们的GitHub页面下载代码并尝试它自己。

GITM的意义超越了电脑游戏。它代表着可以探索和与环境(虚拟的情况下)交互,并制定策略、自主执行的最新版本的通用智能体。想象一下,有一天,这样的GCA可以通过传感器和智能设备进入我们的现实世界,以自主的方式解决我们的现实问题。让我们屏吸期待。

致力于传播优质的中国知识内容、构建全球新共识。我们将通过一系列时事资讯、精品课程、论坛、节目、咨询报告等内容产品,提供关于当代中国的最新的舆论思潮、深入的社会观察、亮眼的科技成就等优质信息。我们已与五大洲十多个国家、百余个研究机构、媒体机构、政治团体、民间组织建立合作关系。希望通过我们的工作在海外分享中国经验,讲述中国故事,客观分析我们共同面对的挑战和机遇,携手全球青年寻找全球化发展的新共识。
联系我们// Substack // Twitter // YouTube // 相关文章


返回博客
1 / 8
  • AI與量子計算:誰將引領未來科技?

    AI与量子计算:谁将引领未来科技?

    多年来,科技公司多年投入数十亿美元于量子计算机,寄希望于它们能在金融、药物研发、物流等多个领域带来颠覆性变革,尤其是在物理和化学领域,这种期待更为强烈,因为量子力学的独特效应在这些领域中发挥着重要作用。

    AI与量子计算:谁将引领未来科技?

    多年来,科技公司多年投入数十亿美元于量子计算机,寄希望于它们能在金融、药物研发、物流等多个领域带来颠覆性变革,尤其是在物理和化学领域,这种期待更为强烈,因为量子力学的独特效应在这些领域中发挥着重要作用。

  • 金剛石晶片的崛起,或引發全球AI半導體競爭新角逐

    金刚石晶片的崛起,或引发全球AI半导体竞争新角逐

    全球各国都在积极加快金刚石在半导体领域的研发步伐,并将其视为未来科技创新的关键材料。从高效能晶片散热解决方案到量子计算和光电应用,金刚石的潜力被各大研究机构和企业广泛看好。

    金刚石晶片的崛起,或引发全球AI半导体竞争新角逐

    全球各国都在积极加快金刚石在半导体领域的研发步伐,并将其视为未来科技创新的关键材料。从高效能晶片散热解决方案到量子计算和光电应用,金刚石的潜力被各大研究机构和企业广泛看好。

  • “微塑膠”成科學界關注焦點,或對人體健康造成潛在威脅

    “微塑胶”成科学界关注焦点,或对人体健康造成潜在威胁

    许多工业生产过程中,尤其是涉及塑胶制造、加工和拆卸的行业,都会产生大量的塑胶废料。这些废料往往被不当处置或遗弃,经过时间的推移,这些废弃塑胶在风力、雨水等自然条件下分解成微塑胶颗粒,进入土壤和水体。

    “微塑胶”成科学界关注焦点,或对人体健康造成潜在威胁

    许多工业生产过程中,尤其是涉及塑胶制造、加工和拆卸的行业,都会产生大量的塑胶废料。这些废料往往被不当处置或遗弃,经过时间的推移,这些废弃塑胶在风力、雨水等自然条件下分解成微塑胶颗粒,进入土壤和水体。

  • 古羅馬混凝土的“耐用秘密”

    古罗马混凝土的“耐用秘密”

    古罗马人以其卓越的建筑和工程技术而闻名。公元128年建成的万神殿/Pantheon是古罗马的一座杰出建筑,拥有世界上最大的无钢筋混凝土圆顶,至今依然完好如初。而与此形成鲜明对比的是,许多现代混凝土结构在短短几十年内就出现了损坏。

    古罗马混凝土的“耐用秘密”

    古罗马人以其卓越的建筑和工程技术而闻名。公元128年建成的万神殿/Pantheon是古罗马的一座杰出建筑,拥有世界上最大的无钢筋混凝土圆顶,至今依然完好如初。而与此形成鲜明对比的是,许多现代混凝土结构在短短几十年内就出现了损坏。

1 / 4
  • “AI虛擬伴侶”導致14歲美國少年自殺,人工智能時代背後的情感孤獨

    “AI虚拟伴侣”导致14岁美国少年自杀,人工智能时代背后的情感孤独

    “我想念你,妹妹。”、“我也想念你,亲爱的哥哥。” 这段对话发生在14岁塞维尔/Sewell Setzer生命的最后一天。在与AI初创公司Character.AI的聊天机器人进行长时间对话后,他在2月28日选择结束自己的生命,开枪自杀身亡。

    “AI虚拟伴侣”导致14岁美国少年自杀,人工智能时代背后的情感孤独

    “我想念你,妹妹。”、“我也想念你,亲爱的哥哥。” 这段对话发生在14岁塞维尔/Sewell Setzer生命的最后一天。在与AI初创公司Character.AI的聊天机器人进行长时间对话后,他在2月28日选择结束自己的生命,开枪自杀身亡。

  • 网络成瘾,沉迷直播間:當今快節奏生活的快感與陷阱?

    网络成瘾,沉迷直播间:当今快节奏生活的快感与陷阱?

    繁忙的社会中,身边的人虽然众多,但真正理解和倾诉的却少之又少。在虚拟中,人们通过短暂的直播互动获得了一时的快乐,然而这并不能真正填补心灵深处的空白。最终,直播所提供的陪伴,无法替代那种深入的、持久的人际关系。

    网络成瘾,沉迷直播间:当今快节奏生活的快感与陷阱?

    繁忙的社会中,身边的人虽然众多,但真正理解和倾诉的却少之又少。在虚拟中,人们通过短暂的直播互动获得了一时的快乐,然而这并不能真正填补心灵深处的空白。最终,直播所提供的陪伴,无法替代那种深入的、持久的人际关系。

  • 從Mr. Beast的崛起到三只羊的隕落:超級網紅為博眼球的背后

    从Mr. Beast的崛起到三只羊的陨落:超级网红为博眼球的背后

    网红文化已经成为一种不可忽视的社会现象和经济力量。随着发展,一些拥有数百万甚至千万人气的超级网红,为了追求流量和关注度,忽视了内容质量和创作者的道德底线,导致劣迹网红频频出现,给整个行业带来了显著的负面影响。

    从Mr. Beast的崛起到三只羊的陨落:超级网红为博眼球的背后

    网红文化已经成为一种不可忽视的社会现象和经济力量。随着发展,一些拥有数百万甚至千万人气的超级网红,为了追求流量和关注度,忽视了内容质量和创作者的道德底线,导致劣迹网红频频出现,给整个行业带来了显著的负面影响。

  • 酒店暗藏攝像頭,偷拍黑色產業鏈

    酒店暗藏摄像头,偷拍黑色产业链

    酒店和民宿频繁发生暗藏摄像头的事件,使我们不得不深思:偷拍背后究竟蕴藏着怎样的利益链条?这些偷拍行为不仅严重侵犯了个人隐私,也对社会的道德标准提出了挑战。这一现象的蔓延,迫使人们对行业监管和法律法规的有效性产生质疑。

    酒店暗藏摄像头,偷拍黑色产业链

    酒店和民宿频繁发生暗藏摄像头的事件,使我们不得不深思:偷拍背后究竟蕴藏着怎样的利益链条?这些偷拍行为不仅严重侵犯了个人隐私,也对社会的道德标准提出了挑战。这一现象的蔓延,迫使人们对行业监管和法律法规的有效性产生质疑。

1 / 4
  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

  • 京東楊笠事件背后:愚昧的社會何去何從?

    京东杨笠事件背后:愚昧的社会何去何从?

    临近双十一,没想到第一场公关战就炸在了京东身上。而更万万没想到的是,翻车的点不是价格,也不是带货主播,而是更尖锐更为敏感的“男女性别”话题,还把脱口秀演员杨笠推向了风口浪尖。

    京东杨笠事件背后:愚昧的社会何去何从?

    临近双十一,没想到第一场公关战就炸在了京东身上。而更万万没想到的是,翻车的点不是价格,也不是带货主播,而是更尖锐更为敏感的“男女性别”话题,还把脱口秀演员杨笠推向了风口浪尖。

1 / 4