中國科學家發布通才智能體完全解鎖《我的世界》,像人類一樣生存,探索和創造!

中國科學家發布通才智能體完全解鎖《我的世界》,像人類一樣生存,探索和創造!

發布日期:

科技 Tech


要點:
一個理想的AI應該具有與人類類似的能力。遊戲“我的世界”里的AI不管是根據其當前的技能水平和世界狀態提出合適的任務、根據環境反饋完善技能并將掌握的技能存入記憶,還是不斷探索世界,以自驅動的方式尋找新任務,其實都已經和現實世界中人類的決策過程和行為方式非常相近。

致力於傳播優質的中國知識內容、搆建全球新共識。我們將通過一系列時事資訊、精品課程、論壇、節目、咨詢報告等內容產品,提供關於當代中國的最新的輿論思潮、深入的社會觀察、亮眼的科技成就等優質信息。我們已與五大洲十多個國家、百余個研究機搆、媒體機搆、政治團體、民間組織建立合作關系。希望通過我們的工作在海外分享中國經驗,講述中國故事,客觀分析我們共同面對的挑戰和機遇,攜手全球青年尋找全球化發展的新共識。
聯系我們 // Substack // Twitter // YouTube//相關文章

你是否喜歡在“Minecraft”廣闊多樣的世界中冒險,挖掘資源,制造工具和建造建筑物?你是否想要一個伙伴來和你一起探險?清華大學和中國科學院的研究人員開發了一個新的AI智能體,可以陪伴你完成任務。他們稱之為Minecraft中的幽靈/Ghost in Minecraft, 簡稱GITM,它不是你平常見到的普通機器人。

Minecraft中的AI智能體們卻面臨着一種有趣的莫拉維克悖論:對於人類來說具有挑戰性的任務,如下棋對於AI來說相對簡單,而對於人類來說通常很容易的任務(如在像Minecraft這樣的開放世界環境中進行互動和決策)卻對AI來說是巨大的挑戰。

via GIPHY

GITM成功地克服了這個悖論,在一個復雜、逼真的環境中取得了重大突破。這對AI技朮的潛在進步和更通用的AI智能體的開發做出了巨大貢獻。

GITM是一個通用智能體/Generally Capable Agent, 簡稱GCA,意味着它可以處理任何任務而不需要特定的培訓或指令。它使用大型語言模型/Large Language Model,簡稱LLM實現這種能力,這基本上意味着它擁有對單詞和常識的廣泛理解。GITM通過自然語言與你交流,并理解你的預期結果。此外,它使用基於文本的知識和記憶來存儲和檢索有用的信息,例如配方、位置和目標。


GITM 在 Minecraft 主世界的所有技術挑戰中實現了 100% 的任務覆蓋率(成功解鎖了完整的技術樹),而之前所有智能加起來只能覆蓋 30%。

研究人員在Minecraft中的一個流行任務“獲取鑽石”上測試了GITM,其任務是找到并挖掘一顆鑽石。這不是一個容易的任務,因為鑽石很少,而且在地下很深處,智能體還必須在途中生存各種危險,如熔岩、怪物和飢餓。以前使用強化學習/RL的方法只能實現約20%的成功率,這意味着它們失敗了5次中的4次。而GITM則取得了驚人的67.5%的成功率,這意味着它在3次嘗試中成功了2次。這是一個巨大的改進!

但GITM并不滿足於鑽石。GITM可以獲得游戲中的所有物品,從木材到玉髓。它可以制造工具、武器和裝甲,建造庇護所和農場,甚至馴服動物。它可以做任何你能做的事情,而且可能做得更好。

GITM是如何實現這一切的呢?它釆用了一種巧妙的方法。以前的AI智能體很難將Minecraft中的復雜目標與完成所需的精確鼠標和鍵槃操作聯系起來。然而,GITM釆用LLM根據當前情況和期望目標生成行動計划。LLM由三個組成部分組成:

LLM Decomposer:利用外部知識,如互聯網上的游戲知識庫,將復雜任務分解為簡單的子任務。

LLM Planner:計為每個子任務制規划一系列的結搆化動作,并根據反饋信息調整規划,還能通過不斷總結成功經驗提升自己

LLM Interface:使用底層的鍵槃鼠標操作執行結搆化動作,并在與環境交互的過程中獲取觀察信息

例如,如果GITM想要制作地獄傳送門,它可以詢問LLM如何制作,LLM會告訴它類似於以下內容:
- 找一些黑曜石、燧石和鋼
- 將黑曜石放在一個4x5的矩形中心有一個2x3的洞
- 用燧石和鋼在底部的黑曜石塊上點燃火
- 進入傳送門

GITM可以逐步執行這些步驟,并使用基於文本的記憶來跟蹤它已經做了什么和接下來需要做什么。它還可以使用基於文本的知識來查找任何需要的信息,例如配方、位置和物品屬性。例如,如果GITM想知道在哪里找到黑曜石,它可以詢問LLM,LLM會告訴它類似於以下內容:
- 黑曜石是一種稀有塊,可以在熔岩池附近找到
- 它有一種深紫色的顏色,很硬
- 它可以用鑽石鎬或更好的工具開釆
- 它是當水遇到熔岩時形成的

GITM可以使用這些信息來指導它的探索和挖掘活動。值得注意的是,GITM不需要GPU進行訓練;一個具有32個CPU核心的單個CPU節點就足夠了。這意味着一個不錯的筆記本電腦就足以運行GITM,相比於OpenAI的VPT和DeepMind的DreamerV3,它可以提高效率至少10,000倍。你甚至可以從它們的GitHub頁面下載代碼并嘗試它自己。

GITM的意義超越了電腦游戲。它代表着可以探索和與環境(虛擬的情況下)交互,并制定策略、自主執行的最新版本的通用智能體。想象一下,有一天,這樣的GCA可以通過傳感器和智能設備進入我們的現實世界,以自主的方式解決我們的現實問題。讓我們屏吸期待。

致力於傳播優質的中國知識內容、搆建全球新共識。我們將通過一系列時事資訊、精品課程、論壇、節目、咨詢報告等內容產品,提供關於當代中國的最新的輿論思潮、深入的社會觀察、亮眼的科技成就等優質信息。我們已與五大洲十多個國家、百余個研究機搆、媒體機搆、政治團體、民間組織建立合作關系。希望通過我們的工作在海外分享中國經驗,講述中國故事,客觀分析我們共同面對的挑戰和機遇,攜手全球青年尋找全球化發展的新共識。
聯系我們 // Substack // Twitter // YouTube//相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回網誌
  • NVDA英偉達2026財年第四季度財報,利潤端持續向好!

    NVDA英偉達2026財年第四季度財報,利潤端持續向好!

    NVDA英偉達本次財報數據依然是相當不錯的,其中收入端本季度環比增長 111 億美元,基本都來自於數據中心業務中 Blackwell 系列量產增加的帶動,公司毛利率也重新回到了 75%。對於下季度指引,公司預計收入端將繼續提升至 780 億美元。

    NVDA英偉達2026財年第四季度財報,利潤端持續向好!

    NVDA英偉達本次財報數據依然是相當不錯的,其中收入端本季度環比增長 111 億美元,基本都來自於數據中心業務中 Blackwell 系列量產增加的帶動,公司毛利率也重新回到了 75%。對於下季度指引,公司預計收入端將繼續提升至 780 億美元。

  • 從傳奇到威脅:Anthropic AI如何破解COBOL現代化僵局,並引發IBM股價巨震

    從傳奇到威脅:Anthropic AI如何破解COBOL現代化僵局,並引發IBM股價巨震

    今日,科技界與華爾街同時感受到了一場強震。人工智慧領先企業 Anthropic 正式發佈了專為 COBOL 現代化設計的 Claude Code 工具與實戰手冊。這項消息發布後,全球科技服務巨頭 IBM 的股價在盤中應聲重挫近 10%。

    從傳奇到威脅:Anthropic AI如何破解COBOL現代化僵局,並引發IBM股價巨震

    今日,科技界與華爾街同時感受到了一場強震。人工智慧領先企業 Anthropic 正式發佈了專為 COBOL 現代化設計的 Claude Code 工具與實戰手冊。這項消息發布後,全球科技服務巨頭 IBM 的股價在盤中應聲重挫近 10%。

  • 美國最高法院裁定川普全球關稅違憲!

    美國最高法院裁定川普全球關稅違憲!

    2月20日,美國最高法院以6比3的投票結果推翻了美國政府在全球徵收的大規模關稅。法院裁定,總統援引《國際緊急經濟權力法》(IEEPA)在全球範圍內徵收關稅屬於越權行為。法院並未就進口商有權獲得退稅的程度作出裁決,而是將此項決定留給了下級法院。

    美國最高法院裁定川普全球關稅違憲!

    2月20日,美國最高法院以6比3的投票結果推翻了美國政府在全球徵收的大規模關稅。法院裁定,總統援引《國際緊急經濟權力法》(IEEPA)在全球範圍內徵收關稅屬於越權行為。法院並未就進口商有權獲得退稅的程度作出裁決,而是將此項決定留給了下級法院。

  • AMZN亞馬遜財報,AWS如期明顯提速

    AMZN亞馬遜財報,AWS如期明顯提速

    AMZN自研芯片也大體解決了獲取 GPU 的劣勢,市場對 AWS 後續的增長前景是非常樂觀的。結合公司披露,AWS 會是未來 2 年內,新增算力供應最多的雲服務商。按此前到 27 年算力翻倍的指引,預期未來 2 年 AWS 會合計新增約 10 GW 算力。

    AMZN亞馬遜財報,AWS如期明顯提速

    AMZN自研芯片也大體解決了獲取 GPU 的劣勢,市場對 AWS 後續的增長前景是非常樂觀的。結合公司披露,AWS 會是未來 2 年內,新增算力供應最多的雲服務商。按此前到 27 年算力翻倍的指引,預期未來 2 年 AWS 會合計新增約 10 GW 算力。

  • GOOG谷歌財報,持續AI投入

    GOOG谷歌財報,持續AI投入

    GOOG 2026 年指引 1750-1850 億美元,同比翻倍,而市場此前預期只有 1300 億!原本以為 Meta 的資本開支已經夠多了,結果谷歌告訴你誰才是財大氣粗的 “真大哥”。

    GOOG谷歌財報,持續AI投入

    GOOG 2026 年指引 1750-1850 億美元,同比翻倍,而市場此前預期只有 1300 億!原本以為 Meta 的資本開支已經夠多了,結果谷歌告訴你誰才是財大氣粗的 “真大哥”。

  • AMD業績,服務器GPU再次疲軟

    AMD業績,服務器GPU再次疲軟

    AMD AI GPU:再次疲軟。拆分來看,公司本季度數據中心的主要增量是來自於 MI308 的再次銷售,而其餘 AI GPU(含 MI355)的環增僅有 1.5 億美元左右。對於 2025 年下半年才開始量產的 MI355,只有這個環增表現,很難讓市場滿意。

    AMD業績,服務器GPU再次疲軟

    AMD AI GPU:再次疲軟。拆分來看,公司本季度數據中心的主要增量是來自於 MI308 的再次銷售,而其餘 AI GPU(含 MI355)的環增僅有 1.5 億美元左右。對於 2025 年下半年才開始量產的 MI355,只有這個環增表現,很難讓市場滿意。

  • PLTR業績,政府訂單和企業客户需求強勁,國際市場增長乏力?

    PLTR業績,政府訂單和企業客户需求強勁,國際市場增長乏力?

    美國政府收入被視作 Palantir 的護城河,本季度主要是前期合同的收入確認,拉動收入增速提高至 60%。12 月 10 日 Palantir 新拿下了一個價值 4.48 億美元的海軍訂單——與美國海軍共同推出 ShipOS,該系統將 Foundry 以及 AIP 技術應用在美國海外作業領域。

    PLTR業績,政府訂單和企業客户需求強勁,國際市場增長乏力?

    美國政府收入被視作 Palantir 的護城河,本季度主要是前期合同的收入確認,拉動收入增速提高至 60%。12 月 10 日 Palantir 新拿下了一個價值 4.48 億美元的海軍訂單——與美國海軍共同推出 ShipOS,該系統將 Foundry 以及 AIP 技術應用在美國海外作業領域。

  • DIS迪士尼2026財年第一季度業績,沒有太多驚喜

    DIS迪士尼2026財年第一季度業績,沒有太多驚喜

    迪士尼一季度業績再次沒有太多驚喜,也沒大雷,但市場似乎不太滿意,財報後股價跌了 6%。關鍵原因在於市場對迪士尼未來長期增長的預判力降低。尤其是在不再披露Disney+訂閲數之後,對支撐估值的流媒體擴張是否有清晰的路線和增長邏輯成為資金主要關心的問題。

    DIS迪士尼2026財年第一季度業績,沒有太多驚喜

    迪士尼一季度業績再次沒有太多驚喜,也沒大雷,但市場似乎不太滿意,財報後股價跌了 6%。關鍵原因在於市場對迪士尼未來長期增長的預判力降低。尤其是在不再披露Disney+訂閲數之後,對支撐估值的流媒體擴張是否有清晰的路線和增長邏輯成為資金主要關心的問題。

1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

    從中國經濟看背後困境及發展新構想?

    中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施,中國經濟可能有一個全新的契機注入新的動力,推動經濟穩定健康發展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

    在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    隨著時代的變遷,人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同,有些人追求的是即時的快樂和成就感,而有些人則看重長期的進步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

    再見愛人:探索現代婚姻中的情感困境

    芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子,麥琳、李行亮,葛夕、劉爽三對情感關系10年以上的夫妻,以“婚姻紀實觀察”為切口,呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

    抖音短劇新風潮:中老年人成為新的增長點?

    近日,不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十,閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事,成了當下短劇創作的“新流量密碼”。

1 / 4