Meta推出V-JEPA 2，世界模型或成为下一个AI新趋势

發布日期:2025年6月11日

要点:
Meta发布V-JEPA 2世界模型，赋予AI类人般的物理直觉与推理能力，助力其在复杂现实环境中实现“先思考、再行动”的智能行为。

从语言生成到图像创作，人工智能在感知层面的突破已令世界惊艳。然而，若要让AI真正融入现实、与世界互动，仅靠“看得见”和“说得出”还远远不够。真正的挑战在于能否让AI“看懂”世界的运行逻辑，并像人类一样，在行动前进行预测与权衡。

今天，Meta宣布推出一种新的人工智能“世界模型”/world model，可以更好地理解3D环境和物理物件的运动。其新的开源AI模型V-JEPA 2能够在物理世界中理解、预测和规划。这些被称为世界模型的系统从物理世界的逻辑中汲取灵感，建构了现实的内部模拟，使AI能够以更像人类的方式学习、规划和决策。

新一代世界模型V-JEPA 2

V-JEPA 2是Meta推出的最先进世界模型之一，专为提升人工智能对物理世界的理解与预测能力而设计。该模型以视频作为训练基础，使机器人和其他AI 代理能够感知现实环境中的因果关系，并预测自身行为将引发的环境变化。

这一技术被视为构建具备“先思考、后行动”能力AI系统的核心支柱，同时标志着Meta在迈向高阶机器智慧/Artificial Machine Intelligence,，简称AMI长期愿景上的重要推进。

人类拥有天生的物理直觉，能预判世界的反应机制：看见网球被抛向空中时，自然会预期它因重力而落下。在人群中穿梭时，会下意识地规避碰撞。在球类运动中，也能主动朝球的未来方向移动。这种直觉建立在对周遭环境持续观察与内在模型的建构之上，让人类能够推演假设性行为的后果。

而V-JEPA 2旨在赋予AI 类似的认知能力，使其能够在复杂环境中做出更合理的判断与行为。 Meta 的世界模型聚焦于“理解、预测、规划”三大智能核心，藉由这些能力的融合，不仅提升了AI的泛化水平，也为其在现实世界中的高效部署打下坚实基础。

Meta日前正式发布的最新一代世界模型V-JEPA 2，是继去年首款视频训练模型V-JEPA面世后的重要升级版本。作为“联合嵌入预测架构”/JEPA的延伸，V-JEPA 2由该公司副总裁兼首席人工智能科学家Yann LeCun率先提出。他强调，V-JEPA的设计目标是推动机器更深入地理解现实世界，使其具备类人思维般的通用推理与规划能力，从而实现更广泛、泛化性更强的智能系统。

与传统生成式方法不同，V-JEPA属于非生成式模型，依赖于在抽象表征空间中预测被遮挡或缺失的视频片段内容进行训练。这种方式避免了逐像素还原的高计算负担，大幅提升了模型训练与推理的效率。据Meta表示，其训练和釆样效率可提升1.5倍至6倍。这一优势源自于JEPA架构中引入的“潜在空间”推理机制，与Meta先前用于图像处理的I-JEPA在理念上一脉相承。

而相较前一代模型，V-JEPA 2在理解、预测和适应方面均实现质的飞跃。模型通过大量视频数据训练，学会辨识物体在物理世界中的行为模式，包括人与物的交互、物体的移动轨迹以及物体之间的动态关系等。

在内部测试中，V-JEPA 2被部署至机器人平台，成功执行伸手、抓取、搬运等基础任务，表现出高度的环境理解力与任务泛化能力。例如，它能识别出滚落桌边的球会继续下落，或是理解被暂时遮挡的物体依然存在。

此外，Meta还特别强调V-JEPA 2在机器人导航与自动驾驶等场景中的应用潜力。由于这些系统需实时理解复杂的现实环境，因此一个高效、低资源消耗、具备物理直觉的世界模型显得至关重要。 V-JEPA 2正是在这一背景下脱颖而出，它不依赖大规模标注数据，而是在简化的潜在表示空间中完成推理，借此掌握物体的运动逻辑、交互规律与环境反应机制，从而为智能机器提供前所未有的洞察力与适应性。

目前，Meta还同步发布三项全新基准测试，旨在推动研究社区评估各类AI模型在视频理解和世界建模方面的性能。通过开放这些工具和数据，Meta希望为研究者与开发者提供前沿资源，加速人工智能领域的进步，并朝着构建更加通用、智能且有益于社会的AI 系统迈进。

在AI领域持续加码的背后，是Meta对其未来战略的深度押注。知情人士透露，Meta正计划向AI基础设施企业Scale AI投资高达140亿美元，并已邀请其CEO Alexandr Wang担任顾问，以强化公司的AI战略布局。

世界模型成为下一个AI新趋势

随着生成式AI应用（如OpenAI的ChatGPT与Google的Gemini）在语言与图像生成领域取得巨大成功，人工智能的研究重点正逐步从语言模型转向更具认知能力的架构：世界模型。这类模型不再只专注于语义理解与文本生成，而是尝试让AI理解并模拟真实世界中的物理因果关系与动态变化，从而在更广泛的场景中实现智能行为的泛化与推理。

去年9月，AI领域的领军人物李飞飞教授宣布为其创立的新创公司World Labs筹得2.3亿美元资金，震动学界与投资圈。这家公司提出“大世界模型”/Large World Model，简称LWM的概念，目标是构建一种具备感知、理解与推演能力的AI架构，使其能够从多模态数据中学习现实世界的结构与规律，进而支援更复杂的实体任务，如机器人操作、自主导航及因果推理。

与此同时，Google/谷歌旗下的DeepMind也积极投入世界模型领域，推出名为Genie的实验性项目。 Genie主打即时模拟功能，能够根据输入生成互动式2D或3D场景，模拟游戏环境中的物理反应与角色行为。这使AI不再只是被动接受资讯，而能主动预测未来情境，并在模拟空间中测试不同策略，类似人类在心中预演行动的能力。

尽管目前仍处于早期阶段，世界模型已展现出广泛应用潜力。从机器人学到自驾车、从医疗模拟到虚拟教学环境，这类模型可作为核心智能引擎，提供决策依据、行为规划与情境推理能力。与传统以数据回馈为主的AI不同，世界模型倾向于建立内部预测机制，在尚未发生的情境中模拟潜在风险与机会，这种能力对于复杂系统尤为关键。

作为投资者，综观全球科技巨头与新创公司的布局趋势，生成式AI已从语言与图像生成拓展到世界级的建模挑战。无论是Meta的V-JEPA 2、Google的Genie，还是World Labs，皆反映出业界对于“让AI更好地理解世界”这一目标的共识。未来的竞争焦点，或将不再仅是谁能产出最自然的对话，而是谁能培养出真正能看、能想、能行动的智能体。

狂呼金融 Convo Finance

投資不僅僅是為了創造財富，更是一種洞察宏觀經濟的態度，見證社會演變與科技發展。我們一起，從大變局中看清發展趨勢，希望從不確定中找到確定。

狂呼金融聚焦於新的社會發展形勢下，金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角，洞察分析每一個趨勢與機會，為廣大投資者創造更高質量、更獨特的金融投資觀點。

狂呼，比一部分人更快、更准地看清市場，讓大眾洞察金融經濟的核心。

聯系我們 | 相關文章

免責聲明：本網站提供的信息僅供一般信息分享目的，並不應被視為投資建議。

返回博客

思钱想后Convo Money

查看全部

Plaud Note AI | 播客Podcast

Plaud Note AI 技术：Plaud APP 整合先进的转录功能，支援112 种语言的快速准确转录。 AI 摘要功能基于GPT-5、Claude 4.0、o3-mini 和Gemini 2.5 Pro（Beta 版）开发，使用者可以建立摘要、会议记录和待办事项列表，从而提高日常工作效率。

Plaud Note AI | 播客Podcast

Plaud Note AI 技术：Plaud APP 整合先进的转录功能，支援112 种语言的快速准确转录。 AI 摘要功能基于GPT-5、Claude 4.0、o3-mini 和Gemini 2.5 Pro（Beta 版）开发，使用者可以建立摘要、会议记录和待办事项列表，从而提高日常工作效率。
Costco財報反映了美國中產的狀況

雖然近幾個季度 Costco 的客單價（剔除匯率和油氣）並沒有明顯向上的趨勢，但似乎仍是體現出了消費者因價格走高，轉向更便宜的消費驅動的傾向。這一點從 Costco 自身更強的線上增長，以及偏弱的續費了也都有體現。

Costco財報反映了美國中產的狀況

雖然近幾個季度 Costco 的客單價（剔除匯率和油氣）並沒有明顯向上的趨勢，但似乎仍是體現出了消費者因價格走高，轉向更便宜的消費驅動的傾向。這一點從 Costco 自身更強的線上增長，以及偏弱的續費了也都有體現。
AI桌面宠物ROPET | 播客Podcast

ROPET作为“桌面宠物”诞生，目标用户是25-40岁的女性。今年1月，ROPET在海外众筹网站上正式发行，在欧美国家售卖了1400台，目前正陆续交付；在日本、韩国和港台地区也已售出8000台左右。

AI桌面宠物ROPET | 播客Podcast

ROPET作为“桌面宠物”诞生，目标用户是25-40岁的女性。今年1月，ROPET在海外众筹网站上正式发行，在欧美国家售卖了1400台，目前正陆续交付；在日本、韩国和港台地区也已售出8000台左右。
NIO自4月低位股价翻倍，蔚来真能「重生」吗？

蔚来之后的爆品周期还能持续吗？这个问题是蔚来最为重要的问题。因为对大多数车企来看，真正大级别的机会都是产品、技术和组织等等问题梳理清楚之后，用一个新平台来推动一个较长时间的新车周期，新周期不是靠单一一款车的爆量，而是新平台下矩阵式的车型爆量。

NIO自4月低位股价翻倍，蔚来真能「重生」吗？

蔚来之后的爆品周期还能持续吗？这个问题是蔚来最为重要的问题。因为对大多数车企来看，真正大级别的机会都是产品、技术和组织等等问题梳理清楚之后，用一个新平台来推动一个较长时间的新车周期，新周期不是靠单一一款车的爆量，而是新平台下矩阵式的车型爆量。
美股、港股及A股处于调整，调整后将再创高峰 | 视频Video

就业市场转弱，金融系统里面的流动性过剩几乎接近用尽，美联署9月份FOMC 应该减息，但市场可能很大程度上已反映减息一码(0.25%)，FedWatch 显示机会率90% ，只减一码，未必有力再升，甚至到跌。

美股、港股及A股处于调整，调整后将再创高峰 | 视频Video

就业市场转弱，金融系统里面的流动性过剩几乎接近用尽，美联署9月份FOMC 应该减息，但市场可能很大程度上已反映减息一码(0.25%)，FedWatch 显示机会率90% ，只减一码，未必有力再升，甚至到跌。
以色列科技创新，中国能学到什么？硬科技VC的十年复盘| 播客Podcast

对话非金融出身、无耀眼光环的理工科年轻人闯入VC行业，经过大浪淘沙，在整个中国VC行业经历巨大转变之际，仍然活在牌桌上。其中，既有硬科技领域的扎实累积、方法论，也能看出，他们充分利用了中国市场和人才。

以色列科技创新，中国能学到什么？硬科技VC的十年复盘| 播客Podcast

对话非金融出身、无耀眼光环的理工科年轻人闯入VC行业，经过大浪淘沙，在整个中国VC行业经历巨大转变之际，仍然活在牌桌上。其中，既有硬科技领域的扎实累积、方法论，也能看出，他们充分利用了中国市场和人才。
LULU财报营收不及市场预期，表现让人失望！

整体上，不达预期的二季度业绩加上再次下修的全年指引，使得公司盘后估计再次暴跌15% 以上，核心还是在于无论是本季度的业绩，还是公司对未来的指引，非但没有成长性的边际好转反而还在恶化，没季财报噩耗连珠，因此只能继续杀估值。

LULU财报营收不及市场预期，表现让人失望！

整体上，不达预期的二季度业绩加上再次下修的全年指引，使得公司盘后估计再次暴跌15% 以上，核心还是在于无论是本季度的业绩，还是公司对未来的指引，非但没有成长性的边际好转反而还在恶化，没季财报噩耗连珠，因此只能继续杀估值。
对话前OpenAI科学家：GPT-5能获得奥赛金牌，但那可能具有欺骗性？ | 播客Podcast

对话OpenAI 的两位前科学家：Kenneth Stanley和Joel Lehman；他们曾亲历前ChatGPT 时代的OpenAI，也是《为什么伟大不能被计划》一书的作者。 2023 年，这本书曾在中国科技圈掀起阅读的趋势。那正是ChatGPT 席卷全球、掀开大模型浪潮的一年。

对话前OpenAI科学家：GPT-5能获得奥赛金牌，但那可能具有欺骗性？ | 播客Podcast

对话OpenAI 的两位前科学家：Kenneth Stanley和Joel Lehman；他们曾亲历前ChatGPT 时代的OpenAI，也是《为什么伟大不能被计划》一书的作者。 2023 年，这本书曾在中国科技圈掀起阅读的趋势。那正是ChatGPT 席卷全球、掀开大模型浪潮的一年。

1 8

查看全部

流科百世Convo Tech

查看全部

肿瘤疗法突破，中国团队给癌细胞打上“猪”标签，癌细胞“伪装术”被破解

近期，中国科学家在“Cell”杂志上发表的一项突破性研究，为这一顽疾提供了全新思路。他们利用基因编辑技术，将癌细胞改造成免疫系统眼中的“异类”，类似于人体对猪器官产生的超急性排斥反应，从而引发了一场针对癌细胞的精准“免疫歼灭战”。

肿瘤疗法突破，中国团队给癌细胞打上“猪”标签，癌细胞“伪装术”被破解

近期，中国科学家在“Cell”杂志上发表的一项突破性研究，为这一顽疾提供了全新思路。他们利用基因编辑技术，将癌细胞改造成免疫系统眼中的“异类”，类似于人体对猪器官产生的超急性排斥反应，从而引发了一场针对癌细胞的精准“免疫歼灭战”。
新型大脑设备首次读出内心声音，脑机接口技术打破失语者困境

新系统的核心原理与常见的“尝试说话”型脑机介面相似，都是在大脑运动皮质植入感测器，这一区域负责向声道肌肉下达运动指令。感测器捕捉到的神经活动会送入机器学习模型，模型依据个人化数据判断信号对应的声音，进而预测使用者想说的单字。

新型大脑设备首次读出内心声音，脑机接口技术打破失语者困境

新系统的核心原理与常见的“尝试说话”型脑机介面相似，都是在大脑运动皮质植入感测器，这一区域负责向声道肌肉下达运动指令。感测器捕捉到的神经活动会送入机器学习模型，模型依据个人化数据判断信号对应的声音，进而预测使用者想说的单字。
“垃圾DNA”新发现：远古病毒DNA在人类发育中发挥关键作用

自这类非编码DNA片段首次被发现并被称作“垃圾”以来，生物学家们一直在探讨它们是否真的无用。如今的主流观点认为，这些片段虽不直接参与蛋白质合成，却在整体基因组中占据了极大比例，显示它们可能具有重要功能。

“垃圾DNA”新发现：远古病毒DNA在人类发育中发挥关键作用

自这类非编码DNA片段首次被发现并被称作“垃圾”以来，生物学家们一直在探讨它们是否真的无用。如今的主流观点认为，这些片段虽不直接参与蛋白质合成，却在整体基因组中占据了极大比例，显示它们可能具有重要功能。
颠覆传统认知，科学家首次证明植物和动物透过声音互动

最新的研究将植物的感知能力推向了新的维度：听觉。这项研究透过多个实验并设置了精确的装置，观察到一个惊人的现象：在没有植物存在的环境中，蛾更倾向于在播放录制的植物压力声音的扬声器附近产卵。

颠覆传统认知，科学家首次证明植物和动物透过声音互动

最新的研究将植物的感知能力推向了新的维度：听觉。这项研究透过多个实验并设置了精确的装置，观察到一个惊人的现象：在没有植物存在的环境中，蛾更倾向于在播放录制的植物压力声音的扬声器附近产卵。

1 4

查看全部

观点Opinion

查看全部

人工智能AI时代，人类如何重拾批判性思维？

作为批判性思维培养的原始土壤：教育，必须进行重塑。教育政策的制定者和学校必须釆取积极措施，将批判性思维的练习深度融入课程。这远不止是增加几节理论课，而是要在每一个学科、每一个学习环节中，鼓励学生质疑和分析AI生成的信息。

人工智能AI时代，人类如何重拾批判性思维？

作为批判性思维培养的原始土壤：教育，必须进行重塑。教育政策的制定者和学校必须釆取积极措施，将批判性思维的练习深度融入课程。这远不止是增加几节理论课，而是要在每一个学科、每一个学习环节中，鼓励学生质疑和分析AI生成的信息。
长城汽车面向35岁以上人才开启专场招聘，职场中的年龄歧视及“35岁现象”挑战引发深思

长期以来，“35岁现象”如无形枷锁，将众多经验丰富、能力成熟的中年人才拒之门外。长城汽车的“35+计划”不仅是一项招聘举措，更是一场关于年龄、经验与价值的社会呼吁，挑战了传统的职场偏见，倡导尊重和激活中年人才的力量，为行业和社会注入了新的活力与希望。

长城汽车面向35岁以上人才开启专场招聘，职场中的年龄歧视及“35岁现象”挑战引发深思

长期以来，“35岁现象”如无形枷锁，将众多经验丰富、能力成熟的中年人才拒之门外。长城汽车的“35+计划”不仅是一项招聘举措，更是一场关于年龄、经验与价值的社会呼吁，挑战了传统的职场偏见，倡导尊重和激活中年人才的力量，为行业和社会注入了新的活力与希望。
打破线性人生，在不确定中寻找多元化的人生出路

近年来，全球经济与地缘格局发生剧烈变化，从疫情冲击、通胀压力，到产业结构重塑，无一不深刻影响着普通人的生活节奏与发展路径。原本被视为“稳定之路”的人生规划：考学、毕业、就业、升职、买房，如今变得越来越不确定。

打破线性人生，在不确定中寻找多元化的人生出路

近年来，全球经济与地缘格局发生剧烈变化，从疫情冲击、通胀压力，到产业结构重塑，无一不深刻影响着普通人的生活节奏与发展路径。原本被视为“稳定之路”的人生规划：考学、毕业、就业、升职、买房，如今变得越来越不确定。
从名校精英到杀手，Luigi Mangione枪击案背后揭示的美国医疗体系

Luigi Mangione用极端方式撕开了美国医疗体系深藏的裂痕，也逼迫社会不得不重新审视，何为正义？何为悲剧。当医疗保障变成逐利机器，当患者在病痛中苦苦挣扎却换来拒绝与冷眼，社会的不满和愤怒便会潜滋暗长，最终以最不可控的方式爆发。

从名校精英到杀手，Luigi Mangione枪击案背后揭示的美国医疗体系

Luigi Mangione用极端方式撕开了美国医疗体系深藏的裂痕，也逼迫社会不得不重新审视，何为正义？何为悲剧。当医疗保障变成逐利机器，当患者在病痛中苦苦挣扎却换来拒绝与冷眼，社会的不满和愤怒便会潜滋暗长，最终以最不可控的方式爆发。

1 4

查看全部

胡说北道Convo Ave(播客)

查看全部

从中国经济看背后困境及发展新构想?

中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施，中国经济可能有一个全新的契机注入新的动力，推动经济稳定健康发展。

从中国经济看背后困境及发展新构想?

中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施，中国经济可能有一个全新的契机注入新的动力，推动经济稳定健康发展。
在变革中的抉择：当今大环境下如何实现职业规划与人生价值？

随着时代的变迁，人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同，有些人追求的是即时的快乐和成就感，而有些人则看重长期的进步和自我超越。

在变革中的抉择：当今大环境下如何实现职业规划与人生价值？

随着时代的变迁，人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同，有些人追求的是即时的快乐和成就感，而有些人则看重长期的进步和自我超越。
再见爱人：探索现代婚姻中的情感困境

芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子，麦琳、李行亮，葛夕、刘爽三对情感关系10年以上的夫妻，以“婚姻纪实观察”为切口，呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

再见爱人：探索现代婚姻中的情感困境

芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子，麦琳、李行亮，葛夕、刘爽三对情感关系10年以上的夫妻，以“婚姻纪实观察”为切口，呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。
抖音短剧新风潮：中老年人成为新的增长点?

近日，不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十，闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事，成了当下短剧创作的“新流量密码”。

抖音短剧新风潮：中老年人成为新的增长点?

近日，不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十，闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事，成了当下短剧创作的“新流量密码”。

1 4

查看全部

新一代世界模型V-JEPA 2

世界模型成为下一个AI新趋势

免费订阅优质资讯