Meta推出V-JEPA 2,世界模型或成為下一個AI新趨勢

Meta推出V-JEPA 2,世界模型或成为下一个AI新趋势

發布日期:

商業 Business 狂呼金融 Convo Finance 科技 Tech


要点:
Meta发布V-JEPA 2世界模型,赋予AI类人般的物理直觉与推理能力,助力其在复杂现实环境中实现“先思考、再行动”的智能行为。

从语言生成到图像创作,人工智能在感知层面的突破已令世界惊艳。然而,若要让AI真正融入现实、与世界互动,仅靠“看得见”和“说得出”还远远不够。真正的挑战在于能否让AI“看懂”世界的运行逻辑,并像人类一样,在行动前进行预测与权衡。

今天,Meta宣布推出一种新的人工智能“世界模型”/world model,可以更好地理解3D环境和物理物件的运动。其新的开源AI模型V-JEPA 2能够在物理世界中理解、预测和规划。这些被称为世界模型的系统从物理世界的逻辑中汲取灵感,建构了现实的内部模拟,使AI能够以更像人类的方式学习、规划和决策。

新一代世界模型V-JEPA 2

V-JEPA 2是Meta推出的最先进世界模型之一,专为提升人工智能对物理世界的理解与预测能力而设计。该模型以视频作为训练基础,使机器人和其他AI 代理能够感知现实环境中的因果关系,并预测自身行为将引发的环境变化。

这一技术被视为构建具备“先思考、后行动”能力AI系统的核心支柱,同时标志着Meta在迈向高阶机器智慧/Artificial Machine Intelligence,,简称AMI长期愿景上的重要推进。

人类拥有天生的物理直觉,能预判世界的反应机制:看见网球被抛向空中时,自然会预期它因重力而落下。在人群中穿梭时,会下意识地规避碰撞。在球类运动中,也能主动朝球的未来方向移动。这种直觉建立在对周遭环境持续观察与内在模型的建构之上,让人类能够推演假设性行为的后果。

而V-JEPA 2旨在赋予AI 类似的认知能力,使其能够在复杂环境中做出更合理的判断与行为。 Meta 的世界模型聚焦于“理解、预测、规划”三大智能核心,藉由这些能力的融合,不仅提升了AI的泛化水平,也为其在现实世界中的高效部署打下坚实基础。

Meta日前正式发布的最新一代世界模型V-JEPA 2,是继去年首款视频训练模型V-JEPA面世后的重要升级版本。作为“联合嵌入预测架构”/JEPA的延伸,V-JEPA 2由该公司副总裁兼首席人工智能科学家Yann LeCun率先提出。他强调,V-JEPA的设计目标是推动机器更深入地理解现实世界,使其具备类人思维般的通用推理与规划能力,从而实现更广泛、泛化性更强的智能系统。

与传统生成式方法不同,V-JEPA属于非生成式模型,依赖于在抽象表征空间中预测被遮挡或缺失的视频片段内容进行训练。这种方式避免了逐像素还原的高计算负担,大幅提升了模型训练与推理的效率。据Meta表示,其训练和釆样效率可提升1.5倍至6倍。这一优势源自于JEPA架构中引入的“潜在空间”推理机制,与Meta先前用于图像处理的I-JEPA在理念上一脉相承。

而相较前一代模型,V-JEPA 2在理解、预测和适应方面均实现质的飞跃。模型通过大量视频数据训练,学会辨识物体在物理世界中的行为模式,包括人与物的交互、物体的移动轨迹以及物体之间的动态关系等。

在内部测试中,V-JEPA 2被部署至机器人平台,成功执行伸手、抓取、搬运等基础任务,表现出高度的环境理解力与任务泛化能力。例如,它能识别出滚落桌边的球会继续下落,或是理解被暂时遮挡的物体依然存在。

此外,Meta还特别强调V-JEPA 2在机器人导航与自动驾驶等场景中的应用潜力。由于这些系统需实时理解复杂的现实环境,因此一个高效、低资源消耗、具备物理直觉的世界模型显得至关重要。 V-JEPA 2正是在这一背景下脱颖而出,它不依赖大规模标注数据,而是在简化的潜在表示空间中完成推理,借此掌握物体的运动逻辑、交互规律与环境反应机制,从而为智能机器提供前所未有的洞察力与适应性。

目前,Meta还同步发布三项全新基准测试,旨在推动研究社区评估各类AI模型在视频理解和世界建模方面的性能。通过开放这些工具和数据,Meta希望为研究者与开发者提供前沿资源,加速人工智能领域的进步,并朝着构建更加通用、智能且有益于社会的AI 系统迈进。

在AI领域持续加码的背后,是Meta对其未来战略的深度押注。知情人士透露,Meta正计划向AI基础设施企业Scale AI投资高达140亿美元,并已邀请其CEO Alexandr Wang担任顾问,以强化公司的AI战略布局。

世界模型成为下一个AI新趋势

随着生成式AI应用(如OpenAI的ChatGPT与Google的Gemini)在语言与图像生成领域取得巨大成功,人工智能的研究重点正逐步从语言模型转向更具认知能力的架构:世界模型。这类模型不再只专注于语义理解与文本生成,而是尝试让AI理解并模拟真实世界中的物理因果关系与动态变化,从而在更广泛的场景中实现智能行为的泛化与推理。

去年9月,AI领域的领军人物李飞飞教授宣布为其创立的新创公司World Labs筹得2.3亿美元资金,震动学界与投资圈。这家公司提出“大世界模型”/Large World Model,简称LWM的概念,目标是构建一种具备感知、理解与推演能力的AI架构,使其能够从多模态数据中学习现实世界的结构与规律,进而支援更复杂的实体任务,如机器人操作、自主导航及因果推理。

与此同时,Google/谷歌旗下的DeepMind也积极投入世界模型领域,推出名为Genie的实验性项目。 Genie主打即时模拟功能,能够根据输入生成互动式2D或3D场景,模拟游戏环境中的物理反应与角色行为。这使AI不再只是被动接受资讯,而能主动预测未来情境,并在模拟空间中测试不同策略,类似人类在心中预演行动的能力。

尽管目前仍处于早期阶段,世界模型已展现出广泛应用潜力。从机器人学到自驾车、从医疗模拟到虚拟教学环境,这类模型可作为核心智能引擎,提供决策依据、行为规划与情境推理能力。与传统以数据回馈为主的AI不同,世界模型倾向于建立内部预测机制,在尚未发生的情境中模拟潜在风险与机会,这种能力对于复杂系统尤为关键。

作为投资者,综观全球科技巨头与新创公司的布局趋势,生成式AI已从语言与图像生成拓展到世界级的建模挑战。无论是Meta的V-JEPA 2、Google的Genie,还是World Labs,皆反映出业界对于“让AI更好地理解世界”这一目标的共识。未来的竞争焦点,或将不再仅是谁能产出最自然的对话,而是谁能培养出真正能看、能想、能行动的智能体。

狂呼金融 Convo Finance

投資不僅僅是為了創造財富,更是一種洞察宏觀經濟的態度,見證社會演變與科技發展。我們一起,從大變局中看清發展趨勢,希望從不確定中找到確定。

狂呼金融聚焦於新的社會發展形勢下,金融與經濟對當今世界日益凸顯的影響。以全面、理性的投資視角,洞察分析每一個趨勢與機會,為廣大投資者創造更高質量、更獨特的金融投資觀點。

狂呼,比一部分人更快、更准地看清市場,讓大眾洞察金融經濟的核心。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • PDD拼多多2026年第一季財報,不及市場預期

    PDD拼多多2026年第一季财报,不及市场预期

    因国内主站营收增长不及预期,营销支出也并未明显下滑,因此实际利润表现并不及预期。分板块来看背后原因,我们认为一方面是 Temu 本季减亏的幅度大概率并没有预期的那么多,另外国内主站的经营利润增长应当也相当有限。

    PDD拼多多2026年第一季财报,不及市场预期

    因国内主站营收增长不及预期,营销支出也并未明显下滑,因此实际利润表现并不及预期。分板块来看背后原因,我们认为一方面是 Temu 本季减亏的幅度大概率并没有预期的那么多,另外国内主站的经营利润增长应当也相当有限。

  • 小米2026年第一季度財報,主要受手機和汽車毛利率同比回落影響

    小米2026年第一季度财报,主要受手机和汽车毛利率同比回落影响

    小米本季度汽车业务毛利率下滑至 20.1%,接近市场预期(20.5%),主要是受均价下滑的影响,其中包含了小米对购置税进行补贴的影响,并在本季度销售了一部分的低价现车。由于毛利率再次回落,海豚君测算本季度小米汽车业务核心经营利润再度陷入亏损 31 亿元。

    小米2026年第一季度财报,主要受手机和汽车毛利率同比回落影响

    小米本季度汽车业务毛利率下滑至 20.1%,接近市场预期(20.5%),主要是受均价下滑的影响,其中包含了小米对购置税进行补贴的影响,并在本季度销售了一部分的低价现车。由于毛利率再次回落,海豚君测算本季度小米汽车业务核心经营利润再度陷入亏损 31 亿元。

  • NVDA英偉達2027財年第一季度財報,收入752億美元,環比增量為129億美元

    英伟达2027财年第一季度财报,收入752亿美元,环比增量为129亿美元

    NVDA核心经营指标:总收入816亿美元,好于上调后的买方预期(780-800亿美元),其中季度环比增长135亿美元,几乎都来自于数据中心业务中Blackwell量产增加的带动。

    英伟达2027财年第一季度财报,收入752亿美元,环比增量为129亿美元

    NVDA核心经营指标:总收入816亿美元,好于上调后的买方预期(780-800亿美元),其中季度环比增长135亿美元,几乎都来自于数据中心业务中Blackwell量产增加的带动。

  • BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    比亚迪2025年第四季度业绩仍然不及预期,卖车单价仍处于下行轨道

    比亚迪的业绩仍然不及预期。收入虽超预期,但主要由于非核心的比亚迪电子业务高增带来,而在核心的卖车业务上,卖车单价仍处于下行轨道,卖车成本降幅不够,最后卖车毛利率虽有回暖,但仍低于市场预期。

    比亚迪2025年第四季度业绩仍然不及预期,卖车单价仍处于下行轨道

    比亚迪的业绩仍然不及预期。收入虽超预期,但主要由于非核心的比亚迪电子业务高增带来,而在核心的卖车业务上,卖车单价仍处于下行轨道,卖车成本降幅不够,最后卖车毛利率虽有回暖,但仍低于市场预期。

  • GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    GOOG谷歌TurboQuant新闻导致MU美光科技等内存股股价暴跌,但这合理吗?

    消息一出,华尔街一度陷入恐慌:如果 AI 突然间不再需要那么多 RAM 就能运作,这是否意味着内存产业的“超级周期”即将结束?答案是否定的。事实上,从历史规律与经济学角度来看,情况正好相反。要理解这一点,我们只需要观察你电脑上的网页浏览器。

    GOOG谷歌TurboQuant新闻导致MU美光科技等内存股股价暴跌,但这合理吗?

    消息一出,华尔街一度陷入恐慌:如果 AI 突然间不再需要那么多 RAM 就能运作,这是否意味着内存产业的“超级周期”即将结束?答案是否定的。事实上,从历史规律与经济学角度来看,情况正好相反。要理解这一点,我们只需要观察你电脑上的网页浏览器。

  • BABA財報AI投入比較激進

    BABA财报AI投入比较激进

    BABA发布第四季财报后股价下跌,财报显示其营收和利润均大幅低于预期。这家電商巨头的季度净利暴跌67%,而总营收仅增长1.7%约413亿美元。这些表现引发了人们对阿里巴巴在AI人工智能领域巨额投资(总额超过530亿美元)有效性的担忧。

    BABA财报AI投入比较激进

    BABA发布第四季财报后股价下跌,财报显示其营收和利润均大幅低于预期。这家電商巨头的季度净利暴跌67%,而总营收仅增长1.7%约413亿美元。这些表现引发了人们对阿里巴巴在AI人工智能领域巨额投资(总额超过530亿美元)有效性的担忧。

  • MU美光業績,季度毛利率達到 74.4%!

    MU美光业绩,季度毛利率达到 74.4%!

    MU 整体业绩:美光本季度营收 238.6 亿美元,环比增长 75%,好于上调后的买方预期(199 亿美元),本季度收入增长主要来自于 DRAM 和 NAND 业务的双重带动,两大业务环增都在 70% 以上。

    MU美光业绩,季度毛利率达到 74.4%!

    MU 整体业绩:美光本季度营收 238.6 亿美元,环比增长 75%,好于上调后的买方预期(199 亿美元),本季度收入增长主要来自于 DRAM 和 NAND 业务的双重带动,两大业务环增都在 70% 以上。

  • Tencent騰訊業績整體看無驚無喜?

    腾讯业绩整体看无惊无喜?

    腾讯一口气连发多个“龙虾”产品,能够看出公司在元宝春节大战中失利后的焦虑,虽然仓促推出产品还不完善。不过这个紧迫感的转变很关键也很必要。就目前来看,微信入口似乎在 AI 原生应用盛行的当下仍然有无法撼动的地位。

    腾讯业绩整体看无惊无喜?

    腾讯一口气连发多个“龙虾”产品,能够看出公司在元宝春节大战中失利后的焦虑,虽然仓促推出产品还不完善。不过这个紧迫感的转变很关键也很必要。就目前来看,微信入口似乎在 AI 原生应用盛行的当下仍然有无法撼动的地位。

1 / 8
  • Sharpa機器人削蘋果

    Sharpa机器人削苹果

    对人类来说,削苹果是件轻而易举的晨间小事,但对机器人而言,这是双手协调能力的「终极挑战」。 Sharpa机器人正在为能够像人类一样灵巧地完成复杂家务和工业装配的机器人铺平道路。

    Sharpa机器人削苹果

    对人类来说,削苹果是件轻而易举的晨间小事,但对机器人而言,这是双手协调能力的「终极挑战」。 Sharpa机器人正在为能够像人类一样灵巧地完成复杂家务和工业装配的机器人铺平道路。

  • 腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    肿瘤疗法突破,中国团队给癌细胞打上“猪”标签,癌细胞“伪装术”被破解

    近期,中国科学家在“Cell”杂志上发表的一项突破性研究,为这一顽疾提供了全新思路。他们利用基因编辑技术,将癌细胞改造成免疫系统眼中的“异类”,类似于人体对猪器官产生的超急性排斥反应,从而引发了一场针对癌细胞的精准“免疫歼灭战”。

    肿瘤疗法突破,中国团队给癌细胞打上“猪”标签,癌细胞“伪装术”被破解

    近期,中国科学家在“Cell”杂志上发表的一项突破性研究,为这一顽疾提供了全新思路。他们利用基因编辑技术,将癌细胞改造成免疫系统眼中的“异类”,类似于人体对猪器官产生的超急性排斥反应,从而引发了一场针对癌细胞的精准“免疫歼灭战”。

  • 新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新型大脑设备首次读出内心声音,脑机接口技术打破失语者困境

    新系统的核心原理与常见的“尝试说话”型脑机介面相似,都是在大脑运动皮质植入感测器,这一区域负责向声道肌肉下达运动指令。感测器捕捉到的神经活动会送入机器学习模型,模型依据个人化数据判断信号对应的声音,进而预测使用者想说的单字。

    新型大脑设备首次读出内心声音,脑机接口技术打破失语者困境

    新系统的核心原理与常见的“尝试说话”型脑机介面相似,都是在大脑运动皮质植入感测器,这一区域负责向声道肌肉下达运动指令。感测器捕捉到的神经活动会送入机器学习模型,模型依据个人化数据判断信号对应的声音,进而预测使用者想说的单字。

  • “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    “垃圾DNA”新发现:远古病毒DNA在人类发育中发挥关键作用

    自这类非编码DNA片段首次被发现并被称作“垃圾”以来,生物学家们一直在探讨它们是否真的无用。如今的主流观点认为,这些片段虽不直接参与蛋白质合成,却在整体基因组中占据了极大比例,显示它们可能具有重要功能。

    “垃圾DNA”新发现:远古病毒DNA在人类发育中发挥关键作用

    自这类非编码DNA片段首次被发现并被称作“垃圾”以来,生物学家们一直在探讨它们是否真的无用。如今的主流观点认为,这些片段虽不直接参与蛋白质合成,却在整体基因组中占据了极大比例,显示它们可能具有重要功能。

1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4