Meta推出V-JEPA 2，世界模型或成為下一個AI新趨勢

發布日期:2025年6月11日

要點:
Meta發布V-JEPA 2世界模型，賦予AI類人般的物理直覺與推理能力，助力其在復雜現實環境中實現“先思考、再行動”的智能行為。

從語言生成到圖像創作，人工智能在感知層面的突破已令世界驚艷。然而，若要讓AI真正融入現實、與世界互動，僅靠“看得見”和“說得出”還遠遠不夠。真正的挑戰在於能否讓AI“看懂”世界的運行邏輯，并像人類一樣，在行動前進行預測與權衡。

今天，Meta宣布推出一種新的人工智能“世界模型”/world model，可以更好地理解3D環境和物理物件的運動。其新的開源AI模型V-JEPA 2能夠在物理世界中理解、預測和規劃。這些被稱為世界模型的系統從物理世界的邏輯中汲取靈感，建構了現實的內部模擬，使AI能夠以更像人類的方式學習、規劃和決策。

新一代世界模型V-JEPA 2

V-JEPA 2是Meta推出的最先進世界模型之一，專為提升人工智能對物理世界的理解與預測能力而設計。該模型以視頻作為訓練基礎，使機器人和其他 AI 代理能夠感知現實環境中的因果關系，并預測自身行為將引發的環境變化。

這一技朮被視為搆建具備“先思考、后行動”能力AI系統的核心支柱，同時標志着Meta在邁向高階機器智慧/Artificial Machine Intelligence,，簡稱AMI長期願景上的重要推進。

人類擁有天生的物理直覺，能預判世界的反應機制：看見網球被拋向空中時，自然會預期它因重力而落下。在人群中穿梭時，會下意識地規避碰撞。在球類運動中，也能主動朝球的未來方向移動。這種直覺建立在對周遭環境持續觀察與內在模型的建搆之上，讓人類能夠推演假設性行為的后果。

而V-JEPA 2旨在賦予 AI 類似的認知能力，使其能夠在復雜環境中做出更合理的判斷與行為。Meta 的世界模型聚焦於“理解、預測、規划”三大智能核心，藉由這些能力的融合，不僅提升了AI的泛化水平，也為其在現實世界中的高效部署打下堅實基礎。

Meta日前正式發布的最新一代世界模型V-JEPA 2，是繼去年首款視頻訓練模型V-JEPA面世后的重要升級版本。作為“聯合嵌入預測架搆”/JEPA的延伸，V-JEPA 2由該公司副總裁兼首席人工智能科學家Yann LeCun率先提出。他強調，V-JEPA的設計目標是推動機器更深入地理解現實世界，使其具備類人思維般的通用推理與規划能力，從而實現更廣泛、泛化性更強的智能系統。

與傳統生成式方法不同，V-JEPA屬於非生成式模型，依賴於在抽象表徵空間中預測被遮擋或缺失的視頻片段內容進行訓練。這種方式避免了逐像素還原的高計算負擔，大幅提升了模型訓練與推理的效率。據Meta表示，其訓練和釆樣效率可提升1.5倍至6倍。這一優勢源自於JEPA架搆中引入的“潛在空間”推理機制，與Meta先前用於圖像處理的I-JEPA在理念上一脈相承。

而相較前一代模型，V-JEPA 2在理解、預測和適應方面均實現質的飛躍。模型通過大量視頻數據訓練，學會辨識物體在物理世界中的行為模式，包括人與物的交互、物體的移動軌跡以及物體之間的動態關系等。

在內部測試中，V-JEPA 2被部署至機器人平台，成功執行伸手、抓取、搬運等基礎任務，表現出高度的環境理解力與任務泛化能力。例如，它能識別出滾落桌邊的球會繼續下落，或是理解被暫時遮擋的物體依然存在。

此外，Meta還特別強調V-JEPA 2在機器人導航與自動駕駛等場景中的應用潛力。由於這些系統需實時理解復雜的現實環境，因此一個高效、低資源消耗、具備物理直覺的世界模型顯得至關重要。V-JEPA 2正是在這一背景下脫穎而出，它不依賴大規模標注數據，而是在簡化的潛在表示空間中完成推理，借此掌握物體的運動邏輯、交互規律與環境反應機制，從而為智能機器提供前所未有的洞察力與適應性。

目前，Meta還同步發布三項全新基准測試，旨在推動研究社區評估各類AI模型在視頻理解和世界建模方面的性能。通過開放這些工具和數據，Meta希望為研究者與開發者提供前沿資源，加速人工智能領域的進步，并朝着搆建更加通用、智能且有益於社會的 AI 系統邁進。

在AI領域持續加碼的背后，是Meta對其未來戰略的深度押注。知情人士透露，Meta正計划向AI基礎設施企業Scale AI投資高達140億美元，并已邀請其CEO Alexandr Wang擔任顧問，以強化公司的AI戰略布局。

世界模型成為下一個AI新趨勢

隨著生成式AI應用（如OpenAI的ChatGPT與Google的Gemini）在語言與圖像生成領域取得巨大成功，人工智能的研究重點正逐步從語言模型轉向更具認知能力的架構：世界模型。這類模型不再只專注於語義理解與文本生成，而是嘗試讓AI理解並模擬真實世界中的物理因果關係與動態變化，從而在更廣泛的場景中實現智能行為的泛化與推理。

去年9月，AI領域的領軍人物李飛飛教授宣布為其創立的新創公司World Labs籌得2.3億美元資金，震動學界與投資圈。這家公司提出“大世界模型”/Large World Model，簡稱LWM的概念，目標是構建一種具備感知、理解與推演能力的AI架構，使其能夠從多模態數據中學習現實世界的結構與規律，進而支援更複雜的實體任務，如機器人操作、自主導航及因果推理。

與此同時，Google/谷歌旗下的DeepMind也積極投入世界模型領域，推出名為Genie的實驗性項目。Genie主打即時模擬功能，能夠根據輸入生成互動式2D或3D場景，模擬遊戲環境中的物理反應與角色行為。這使AI不再只是被動接受資訊，而能主動預測未來情境，並在模擬空間中測試不同策略，類似人類在心中預演行動的能力。

儘管目前仍處於早期階段，世界模型已展現出廣泛應用潛力。從機器人學到自駕車、從醫療模擬到虛擬教學環境，這類模型可作為核心智能引擎，提供決策依據、行為規劃與情境推理能力。與傳統以數據回饋為主的AI不同，世界模型傾向於建立內部預測機制，在尚未發生的情境中模擬潛在風險與機會，這種能力對於複雜系統尤為關鍵。

作為投資者，綜觀全球科技巨頭與新創公司的佈局趨勢，生成式AI已從語言與圖像生成拓展到世界級的建模挑戰。無論是Meta的V-JEPA 2、Google的Genie，還是World Labs，皆反映出業界對於“讓AI更好地理解世界”這一目標的共識。未來的競爭焦點，或將不再僅是誰能產出最自然的對話，而是誰能培養出真正能看、能想、能行動的智能體。

狂呼金融 Convo Finance

投資不僅僅是為了創造財富，更是一種洞察宏觀經濟的態度，見證社會演變與科技發展。我們一起，從大變局中看清發展趨勢，希望從不確定中找到確定。

狂呼金融聚焦於新的社會發展形勢下，金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角，洞察分析每一個趨勢與機會，為廣大投資者創造更高質量、更獨特的金融投資觀點。

狂呼，比一部分人更快、更准地看清市場，讓大眾洞察金融經濟的核心。

聯系我們 | 相關文章

免責聲明：本網站提供的信息僅供一般信息分享目的，並不應被視為投資建議。

返回網誌

思錢想後Convo Money

查看全部

Plaud Note AI | 播客Podcast

Plaud Note AI 技術：Plaud APP 整合先進的轉錄功能，支援 112 種語言的快速準確轉錄。 AI 摘要功能基於 GPT-5、Claude 4.0、o3-mini 和 Gemini 2.5 Pro（Beta 版）開發，使用者可以建立摘要、會議記錄和待辦事項列表，從而提高日常工作效率。

Plaud Note AI | 播客Podcast

Plaud Note AI 技術：Plaud APP 整合先進的轉錄功能，支援 112 種語言的快速準確轉錄。 AI 摘要功能基於 GPT-5、Claude 4.0、o3-mini 和 Gemini 2.5 Pro（Beta 版）開發，使用者可以建立摘要、會議記錄和待辦事項列表，從而提高日常工作效率。
Costco財報反映了美國中產的狀況

雖然近幾個季度 Costco 的客單價（剔除匯率和油氣）並沒有明顯向上的趨勢，但似乎仍是體現出了消費者因價格走高，轉向更便宜的消費驅動的傾向。這一點從 Costco 自身更強的線上增長，以及偏弱的續費了也都有體現。

Costco財報反映了美國中產的狀況

雖然近幾個季度 Costco 的客單價（剔除匯率和油氣）並沒有明顯向上的趨勢，但似乎仍是體現出了消費者因價格走高，轉向更便宜的消費驅動的傾向。這一點從 Costco 自身更強的線上增長，以及偏弱的續費了也都有體現。
AI桌面寵物ROPET | 播客Podcast

ROPET作為“桌面寵物”誕生，目標用戶是25-40歲的女性。今年1月，ROPET在海外眾籌網站上正式發行，在歐美國家售賣了1400台，目前正陸續交付；在日本、韓國和港台地區也已售出8000台左右。

AI桌面寵物ROPET | 播客Podcast

ROPET作為“桌面寵物”誕生，目標用戶是25-40歲的女性。今年1月，ROPET在海外眾籌網站上正式發行，在歐美國家售賣了1400台，目前正陸續交付；在日本、韓國和港台地區也已售出8000台左右。
NIO自4月低位股價翻倍，蔚來真能「重生」嗎？

蔚來之後的爆品週期還能持續嗎？這個問題是蔚來最為重要的問題。因為對大多數車企來看，真正大級別的機會都是產品、技術和組織等等問題梳理清楚之後，用一個新平台來推動一個較長時間的新車週期，新週期不是靠單一一款車的爆量，而是新平台下矩陣式的車型爆量。

NIO自4月低位股價翻倍，蔚來真能「重生」嗎？

蔚來之後的爆品週期還能持續嗎？這個問題是蔚來最為重要的問題。因為對大多數車企來看，真正大級別的機會都是產品、技術和組織等等問題梳理清楚之後，用一個新平台來推動一個較長時間的新車週期，新週期不是靠單一一款車的爆量，而是新平台下矩陣式的車型爆量。
美股、港股及A股處於調整，調整後將再創高峰 | 視頻Video

就業市場轉弱，金融系統裏面的流動性過剩幾乎接近用盡，美聯署9月份FOMC 應該減息，但市場可能很大程度上已反映減息一碼(0.25%)，FedWatch 顯示機會率90% ，只減一碼，未必有力再升，甚至到跌。

美股、港股及A股處於調整，調整後將再創高峰 | 視頻Video

就業市場轉弱，金融系統裏面的流動性過剩幾乎接近用盡，美聯署9月份FOMC 應該減息，但市場可能很大程度上已反映減息一碼(0.25%)，FedWatch 顯示機會率90% ，只減一碼，未必有力再升，甚至到跌。
以色列科技創新，中國能學到什麼？硬科技VC的十年復盤 | 播客Podcast

對話非金融出身、無耀眼光環的理工科年輕人闖入VC行業，經過大浪淘沙，在整個中國VC行業經歷巨大轉變之際，仍然活在牌桌上。其中，既有硬科技領域的紮實累積、方法論，也能看出，他們充分利用了中國市場和人才。

以色列科技創新，中國能學到什麼？硬科技VC的十年復盤 | 播客Podcast

對話非金融出身、無耀眼光環的理工科年輕人闖入VC行業，經過大浪淘沙，在整個中國VC行業經歷巨大轉變之際，仍然活在牌桌上。其中，既有硬科技領域的紮實累積、方法論，也能看出，他們充分利用了中國市場和人才。
LULU財報營收不及市場預期，表現讓人失望！

整體上，不達預期的二季度業績加上再次下修的全年指引，使得公司盤後估計再次暴跌 15% 以上，核心還是在於無論是本季度的業績，還是公司對未來的指引，非但沒有成長性的邊際好轉反而還在惡化，沒季財報噩耗連珠，因此只能繼續殺估值。

LULU財報營收不及市場預期，表現讓人失望！

整體上，不達預期的二季度業績加上再次下修的全年指引，使得公司盤後估計再次暴跌 15% 以上，核心還是在於無論是本季度的業績，還是公司對未來的指引，非但沒有成長性的邊際好轉反而還在惡化，沒季財報噩耗連珠，因此只能繼續殺估值。
對話前OpenAI科學家：GPT-5能獲得奧賽金牌，但那可能具有欺騙性？ | 播客Podcast

對話 OpenAI 的兩位前科學家：Kenneth Stanley和Joel Lehman；他們曾親歷前ChatGPT 時代的OpenAI，也是《為什麼偉大不能被計劃》一書的作者。2023 年，這本書曾在中國科技圈掀起閱讀的趨勢。那正是ChatGPT 席捲全球、掀開大模型浪潮的一年。

對話前OpenAI科學家：GPT-5能獲得奧賽金牌，但那可能具有欺騙性？ | 播客Podcast

對話 OpenAI 的兩位前科學家：Kenneth Stanley和Joel Lehman；他們曾親歷前ChatGPT 時代的OpenAI，也是《為什麼偉大不能被計劃》一書的作者。2023 年，這本書曾在中國科技圈掀起閱讀的趨勢。那正是ChatGPT 席捲全球、掀開大模型浪潮的一年。

1 8

查看全部

流科百世Convo Tech

查看全部

腫瘤療法突破，中國團隊給癌細胞打上“豬”標簽，癌細胞“偽裝朮”被破解

近期，中國科學家在“Cell”雜志上發表的一項突破性研究，為這一頑疾提供了全新思路。他們利用基因編輯技朮，將癌細胞改造成免疫系統眼中的“異類”，類似於人體對豬器官產生的超急性排斥反應，從而引發了一場針對癌細胞的精准“免疫殲滅戰”。

腫瘤療法突破，中國團隊給癌細胞打上“豬”標簽，癌細胞“偽裝朮”被破解

近期，中國科學家在“Cell”雜志上發表的一項突破性研究，為這一頑疾提供了全新思路。他們利用基因編輯技朮，將癌細胞改造成免疫系統眼中的“異類”，類似於人體對豬器官產生的超急性排斥反應，從而引發了一場針對癌細胞的精准“免疫殲滅戰”。
新型大腦設備首次讀出內心聲音，腦機接口技朮打破失語者困境

新系統的核心原理與常見的“嘗試說話”型腦機介面相似，都是在大腦運動皮質植入感測器，這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型，模型依據個人化數據判斷信號對應的聲音，進而預測使用者想說的單字。

新型大腦設備首次讀出內心聲音，腦機接口技朮打破失語者困境

新系統的核心原理與常見的“嘗試說話”型腦機介面相似，都是在大腦運動皮質植入感測器，這一區域負責向聲道肌肉下達運動指令。感測器捕捉到的神經活動會送入機器學習模型，模型依據個人化數據判斷信號對應的聲音，進而預測使用者想說的單字。
“垃圾DNA”新發現：遠古病毒DNA在人類發育中發揮關鍵作用

自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來，生物學家們一直在探討它們是否真的無用。如今的主流觀點認為，這些片段雖不直接參與蛋白質合成，卻在整體基因組中佔據了極大比例，顯示它們可能具有重要功能。

“垃圾DNA”新發現：遠古病毒DNA在人類發育中發揮關鍵作用

自這類非編碼DNA片段首次被發現並被稱作“垃圾”以來，生物學家們一直在探討它們是否真的無用。如今的主流觀點認為，這些片段雖不直接參與蛋白質合成，卻在整體基因組中佔據了極大比例，顯示它們可能具有重要功能。
顛覆傳統認知，科學家首次證明植物和動物透過聲音互動

最新的研究將植物的感知能力推向了新的維度：聽覺。這項研究透過多個實驗並設置了精確的裝置，觀察到一個驚人的現象：在沒有植物存在的環境中，蛾更傾向於在播放錄製的植物壓力聲音的揚聲器附近產卵。

顛覆傳統認知，科學家首次證明植物和動物透過聲音互動

最新的研究將植物的感知能力推向了新的維度：聽覺。這項研究透過多個實驗並設置了精確的裝置，觀察到一個驚人的現象：在沒有植物存在的環境中，蛾更傾向於在播放錄製的植物壓力聲音的揚聲器附近產卵。

1 4

查看全部

觀點Opinion

查看全部

人工智能AI時代，人類如何重拾批判性思維？

作為批判性思維培養的原始土壤：教育，必須進行重塑。教育政策的制定者和學校必須釆取積極措施，將批判性思維的練習深度融入課程。這遠不止是增加几節理論課，而是要在每一個學科、每一個學習環節中，鼓勵學生質疑和分析AI生成的信息。

人工智能AI時代，人類如何重拾批判性思維？

作為批判性思維培養的原始土壤：教育，必須進行重塑。教育政策的制定者和學校必須釆取積極措施，將批判性思維的練習深度融入課程。這遠不止是增加几節理論課，而是要在每一個學科、每一個學習環節中，鼓勵學生質疑和分析AI生成的信息。
長城汽車面向35歲以上人才開啟專場招聘，職場中的年齡歧視及“35歲現象”挑戰引發深思

長期以來，“35歲現象”如無形枷鎖，將眾多經驗丰富、能力成熟的中年人才拒之門外。長城汽車的“35+計划”不僅是一項招聘舉措，更是一場關於年齡、經驗與價值的社會呼吁，挑戰了傳統的職場偏見，倡導尊重和激活中年人才的力量，為行業和社會注入了新的活力與希望。

長城汽車面向35歲以上人才開啟專場招聘，職場中的年齡歧視及“35歲現象”挑戰引發深思

長期以來，“35歲現象”如無形枷鎖，將眾多經驗丰富、能力成熟的中年人才拒之門外。長城汽車的“35+計划”不僅是一項招聘舉措，更是一場關於年齡、經驗與價值的社會呼吁，挑戰了傳統的職場偏見，倡導尊重和激活中年人才的力量，為行業和社會注入了新的活力與希望。
打破線性人生，在不確定中尋找多元化的人生出路

近年來，全球經濟與地緣格局發生劇烈變化，從疫情沖擊、通脹壓力，到產業結搆重塑，無一不深刻影響着普通人的生活節奏與發展路徑。原本被視為“穩定之路”的人生規划：考學、畢業、就業、升職、買房，如今變得越來越不確定。

打破線性人生，在不確定中尋找多元化的人生出路

近年來，全球經濟與地緣格局發生劇烈變化，從疫情沖擊、通脹壓力，到產業結搆重塑，無一不深刻影響着普通人的生活節奏與發展路徑。原本被視為“穩定之路”的人生規划：考學、畢業、就業、升職、買房，如今變得越來越不確定。
從名校精英到殺手，Luigi Mangione槍擊案背后揭示的美國醫療體系

Luigi Mangione用極端方式撕開了美國醫療體系深藏的裂痕，也逼迫社會不得不重新審視，何為正義？何為悲劇。當醫療保障變成逐利機器，當患者在病痛中苦苦掙扎卻換來拒絕與冷眼，社會的不滿和憤怒便會潛滋暗長，最終以最不可控的方式爆發。

從名校精英到殺手，Luigi Mangione槍擊案背后揭示的美國醫療體系

Luigi Mangione用極端方式撕開了美國醫療體系深藏的裂痕，也逼迫社會不得不重新審視，何為正義？何為悲劇。當醫療保障變成逐利機器，當患者在病痛中苦苦掙扎卻換來拒絕與冷眼，社會的不滿和憤怒便會潛滋暗長，最終以最不可控的方式爆發。

1 4

查看全部

胡說北道Convo Ave(播客)

查看全部

從中國經濟看背後困境及發展新構想?

中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施，中國經濟可能有一個全新的契機注入新的動力，推動經濟穩定健康發展。

從中國經濟看背後困境及發展新構想?

中國未來發展或許可以參考“五環搆想”進行戰略布局。這一搆想包括高等教育培訓、創新科技驅動、產品生產銷售、市場推廣營銷、出海戰略佈局五大領域。通過“五環搆想”的實施，中國經濟可能有一個全新的契機注入新的動力，推動經濟穩定健康發展。
在變革中的抉擇：當今大環境下如何實現職業規劃與人生價值？

隨著時代的變遷，人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同，有些人追求的是即時的快樂和成就感，而有些人則看重長期的進步和自我超越。

在變革中的抉擇：當今大環境下如何實現職業規劃與人生價值？

隨著時代的變遷，人生價值的內涵也變得更加多樣化和個性化。每個人對於“成功”和“幸福”的理解不同，有些人追求的是即時的快樂和成就感，而有些人則看重長期的進步和自我超越。
再見愛人：探索現代婚姻中的情感困境

芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子，麥琳、李行亮，葛夕、劉爽三對情感關系10年以上的夫妻，以“婚姻紀實觀察”為切口，呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。

再見愛人：探索現代婚姻中的情感困境

芒果TV婚姻紀實觀察節目“再見愛人4”邀請黃聖依、楊子，麥琳、李行亮，葛夕、劉爽三對情感關系10年以上的夫妻，以“婚姻紀實觀察”為切口，呈現出不同婚姻樣本在親密關系中的掙扎與甜蜜、桎梏與覺醒。
抖音短劇新風潮：中老年人成為新的增長點?

近日，不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十，閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事，成了當下短劇創作的“新流量密碼”。

抖音短劇新風潮：中老年人成為新的增長點?

近日，不少以老年人為主角的抖音短劇“閃婚五十歲”、“金榜題名之母憑子貴”、“人到五十，閃婚霸總”等等登上熱度榜單。老年人的婚姻、情感以及生活故事，成了當下短劇創作的“新流量密碼”。

1 4

查看全部

新一代世界模型V-JEPA 2

世界模型成為下一個AI新趨勢

免費訂閱优質資訊