中國Monica團隊推出AI Agent “Manus”,或引領人工智能體新時代?

中国Monica团队推出AI Agent “Manus”,或引领人工智能体新时代?

發布日期:

狂呼科技 Convo Tech 科技 Tech


要点:
中国AI公司Monica团队推出的Manus,作为全球首款通用型AI智能体,突破了传统大模型的局限,展示了AI智能体在未来应用中的巨大潜力,引发业界对AI Agent领域的广泛期待。

在人工智能的快速发展中,AI产品逐渐走向了更加智能化、更加具备实际应用价值的方向。随着技术的突破和企业的创新,AI正不断从单一的语言模型走向更复杂的智能系统,能够理解并执行任务,甚至具备类似人类的思考和行动能力。

3月6日凌晨,中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus。据悉,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,显示其性能超越Open AI的同层次大模型。 Manus的重大创新,不仅为人们展示了AI智能体的未来潜力,也激起了业界对于这一领域突破的期待。

Manus:从思考到行动的AI Agent

近日,Manus推出预览版后,仅仅20小时便在网路上引起广泛关注。 “Manus”这一名称源自著名格言“Mens et Manus”,意指“心与手”。它是指一款连接思维和行动的通用人工智能体/AI Agent,不仅能思考、交付答案,还会交付结果。 Manus擅长处理生活和工作各项任务,让你即便在休息的时候它来完成一切。

什么是通用人工智能体/AI Agent?

简单理解就是更接近人类做事步骤的一款机器人。 Manus拥有广泛的应用范围,从制作定制的旅游指南到深入分析特斯拉的股票都能胜任。该团队指出,Manus在GAIA(评估通用人工智能助理解决现实问题的基准)上,在所有三个难度级别中都表现出色,超越了OpenAI等同级别的模型,取得了领先的成绩。

Manus和现有的ChatGPT、Deepseek这类的大模型有什么区别呢?

像ChatGPT和DeepSeek这样的大型语言模型/LLM,它们的核心优势是经过大规模文本数据训练后,具备了强大的语言理解和生成能力。它们能够根据用户输入的提示词生成连贯的文本,执行诸如问答、文本摘要和翻译等自然语言处理任务。然而,LLM本质上是模型,侧重于对语言的预测和生成,缺乏自主行动的能力。

而以Manus为代表的Agent的核心在于自主行动。它不仅能够理解语言,还能够感知环境、做出决策、执行动作,并与外部世界进行交互。 Manus作为agent,意味着它具备了自主规划和执行任务的能力。它能够根据用户指令调用外部工具和资源,完成复杂的任务。 Agent的重点在于“行动”,强调自主规划和计划实施。

而两者的结合,正是人工智能AI发展的趋势!

LLM可以作为Agent的“大脑”,为其提供语言理解和生成能力,而Agent则可以利用LLM的知识和推理能力更好地完成任务。例如,Agent可以利用LLM理解用户指令,然后调用搜索引擎和日历等工具完成预定会议或查询信息等任务。因此,LLM是Agent大脑的组成部分,而Agent是拥有行动能力的主体。 LLM侧重于语言处理,Agent侧重于自主行动,二者的结合将创造出更加智能和强大的AI系统。

在官方发布的视频中,分别介绍了三个Manus在实际使用场景中所完成的工作案例

第一个任务是筛选简历。从15份简历中,为强化学习算法工程师职位推荐合适的候选人,并根据他们在强化学习方面的专业知识对候选人进行排名。

在这个演示中,你甚至不需要手动解压压缩文件或逐一上传其中的简历。 Manus就像一个“实习生”,能够自动解压文件,逐页浏览每一份简历,并提取其中的重要信息。

Manus能够自动理解“解压老板扔过来的打包文件”这一隐性指令,展现出了类似人类实习生的能力。在Manus给出的结果中,不仅包含自动生成的排名建议,还会根据工作经验等关键维度,将候选人分为不同等级。若用户希望以Excel表格的方式展示结果,Manus还能自动通过编写Python脚本来生成相应的表格。

更令人惊讶的是,Manus具备记忆功能,它能在这个过程中记录下“用户更倾向于以表格形式接收结果”这一偏好,并在未来处理类似任务时,优先选择使用表格来呈现结果。

第二个案例是房产筛选。在这个案例中,用户希望在纽约购买房产,并提出了几个具体要求:希望所在社区安全、犯罪率低,且有优质的中小学教育资源。当然,最重要的还有预算,必须足够在每月固定收入的情况下负担得起。

Manus AI在处理这一需求时,将复杂的任务拆解为多个待办事项,包括研究安全社区、识别优质学校、计算预算、搜索房产等。它通过网络搜索,仔细阅读关于纽约最安全社区的文章,并收集相关信息。

接着,Manus编写了一个Python程序,根据用户的收入计算其可负担的房产预算。结合房地产网站上的房价信息,它根据预算范围筛选出符合条件的房产。

最后,Manus将所有收集到的信息整合起来,撰写了一份详细的报告,内容涵盖社区安全分析、学校质量评估、预算分析、推荐房产列表以及相关资源链接,这一切就像一个专业的房地产经纪人所做的工作一样。由于Manus完全基于用户利益进行操作,使用体验也显得格外出色。

在最后一个案例中,Manus展示了其强大的股票价格分析能力。任务是分析过去三年中,英伟达/Nvidia、迈威尔/Marvell Technology科技和台积电/TSMC三只股票价格之间的相关性。尽管这三支股票之间通常有较强的关联性,但对于新手用户来说,快速理清其中的因果关系可能并不容易。

Manus的操作就像一位真正的股票经纪人。它首先通过API访问雅虎金融等信息平台,获取股票历史数据,并交叉验证数据的准确性,避免单一数据源可能带来的误导,确保最终分析结果的可靠性。

在这个案例中,Manus运用了Python编程技能,进行数据分析和可视化,同时结合金融领域的专业工具,最终通过数据图表和详细分析报告向用户清晰地反馈了这些股票之间的因果关系,这就像是金融领域“实习生”在日常工作中做的任务。

此外,Manus官网还展示了十多个它可以应用的场景,例如帮助用户整理旅行行程、提供个性化的旅游路线推荐,甚至可以学习使用各种复杂工具,来高效地完成日常工作。

随着自主学习的加入,AI Agent的通用性得到大幅提升。在用户的实际测试中,Manus能够根据描述的视频画面内容,精准地跨越平台限制,找到某个特定抖音短视频的链接,这展现了其强大的信息处理能力。

突破传统“AI Agent”:模拟人类思考与执行的智能助手

从上述案例可以看出,Manus的真正优势并非传统意义上的“AI Agent”概念,而在于它能够“模拟人类的工作方式”。与单纯的“计算执行”不同,Manus的工作逻辑更接近于“思考并执行指令”。它并没有做出人类无法完成的任务,这也是为何一些体验过当前版本Manus的用户将其形容为“实习生”。

在Manus的官网上,展示了许多它能够完成的任务,其中有一个案例演示了如何在B2B业务中使用Manus,快速、精准地将订货需求与全球供应商匹配。在类似的需求场景中,平台通常会整合全球供应链企业信息,帮助用户完成供货商与需求方的匹配,这在行业内是一种常见做法。但在Manus的案例中,你会看到完全不同的操作方式。

Manus AI釆用了名为“Multiple Agent”的架构,运行在独立的虚拟机中。通过规划代理、执行代理和验证代理的协作机制,它极大地提高了处理复杂任务的效率,并通过并行计算大大缩短了响应时间。

在这一架构中,每个代理都基于独立的语言模型或强化学习模型,通过API或消息队列进行通信。每个任务都在沙盒环境中执行,避免互相干扰,并且能够支持云端扩展。每个独立模型都能够模拟人类处理任务的流程,比如先进行思考与规划,理解复杂的指令并拆解为可执行的步骤,然后调用合适的工具。

换句话说,Manus的多代理架构更像是由多个助理协作完成不同任务,它们负责资源检索、信息对接、有效性验证等,帮助你完成整个工作流程。这不仅像是一个“实习生”,更像是一个微缩版的“部门主管”。

在B2B业务的案例中,Manus通过网页爬虫技术及编写和执行代码的能力,能够在互联网中自动检索信息,依据用户需求,从产品质量、价格、交货能力等多个维度,为用户匹配最合适的供应商。这些信息不仅以图表的方式直观呈现,还能提供进一步的操作建议。

Manus的发布恰逢中国一系列新人工智能产品的推出,尤其是在今年早些时候,DeepSeek R1的发布引起了人们对中国人工智能能力的关注。 DeepSeek宣称其产品可以与OpenAI的GPT等竞争对手相媲美,且使用较旧的硬件和更低的预算。

Manus发布后,许多媒体将其称为“AI代理的'GPT 时刻'到来”,认为这一产品震撼了整个AI圈。然而,由于该产品釆用邀请码制度,并处于内测阶段,除了部分内测用户分享了Manus的实际使用案例外,大多数渴望体验的用户被“挡在门外”。

在一些二手交易平台,一个Manus内测的邀请码被炒到了5万元以上,但却有价无市。在A股市场,新开普、汉得信息、鼎捷数智等AI智能体概念股集体涨停,引发市场狂欢。

然而,引发关注的同时,由于Manus釆用邀请内测的限制,导致多数观众乃至于业内人士无法体验到这一款AI Agent带来的创新体验,这一举动也被业界质疑为“饥饿营销+套壳炒作”。许多媒体人士开始对该产品的真实效果提出疑问,指出,“Manus 这家公司似乎在市场营销上投入了大量资金,通过科技媒体和KOL的转发与点赞来炒作,宣称这是AI代理的'GPT 时刻',或是Agent的DeepSeek时刻,结果却发现创始人是连续创业者。”

但也有AI圈人士表示,“Manus的爆火,其实背后反映的是大众对于以Manus为代表的这一类AI Agent产品的期待,DeepSeek出圈后,中国对于AI大模型底层优化层面的信心逐渐恢复,各大厂商也纷纷接入了这一DeepSeek,在此基础上,下一个现象级的本土AI原生应用何时爆发,成为大家新的期待点,在一定程度上Manus的出圈,无论是营销还是产品形态上都满足了大家的这种期待,只是不知最终这款产品的表现能否达到大众的期待。”

迫于舆论压力,Manus AI合伙人张涛今天两次澄清“从未投入任何市场推广预算”,釆用邀请码机制是“服务器容量有限不得已而为之”。

此前,Manus出现之前,业内便已经纷纷预测,“2025年将成为AI Agent商业化应用元年。”DeepSeek爆火之后,其背后的V3、R1等多款AI大模型带来的工程优化和能力提升,快速引爆了市场热情,在此基础上,谁能基于这些模型能力打造出下一个超级App、超级Agent?成为大众关注的焦点。 Manus出圈背后,谁将成为下一个AI Agent的现象级产品,同样备受市场期待。

随着Manus的发布,我们正在见证人工智能从单纯的语言处理转向更加复杂的任务执行与自主行动的新时代。 Manus不仅仅是一个工具,它是一位能够自主思考并执行任务的“数字助理”,其通过不断学习与优化,逐步接近人类的工作方式,赋能我们更高效地完成日常事务。在这个智能化加速的时代,Manus或许正是未来AI Agent广泛普及的开始,它将重新定义我们与人工智能的关系,推动各行各业迈向更加智能、自动化的未来。

3月11日最新消息:
Manus官方微博宣布,与阿里Qwen通义千问团队正式达成策略合作。双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。目前两家技术团队已展开紧密协作,致力于为中国用户打造更具创造力的通用智能体产品。阿里巴巴的一位发言人证实了这项合作关系。发言人表示:“我们期待与更多全球人工智慧创新者合作。”

狂呼科技 Convo Tech

科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。

狂呼科技,研究,聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。

狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • BILI嗶哩嗶哩2025年二季度財報,整體收入基本符合指引

    BILI哔哩哔哩2025年二季度财报,整体收入基本符合指引

    BILI利润超预期,这次亮点仍然是盈利端,明显超市场预期,但主要是营销费用较低带来。二季度虽然没新游本身营销费用理应不多,但《三谋》有周年庆活动,年初几次赛季更新变动也不小,因此也并非完全不需要额外的营销。

    BILI哔哩哔哩2025年二季度财报,整体收入基本符合指引

    BILI利润超预期,这次亮点仍然是盈利端,明显超市场预期,但主要是营销费用较低带来。二季度虽然没新游本身营销费用理应不多,但《三谋》有周年庆活动,年初几次赛季更新变动也不小,因此也并非完全不需要额外的营销。

  • BIDU百度二季度業績略超預期

    BIDU百度二季度业绩略超预期

    百度智慧云预期中高增长:云业务在当下是风口,高增长自然没得说。不过少了上季度的惊艳,二季度的27% 增长符合市场大部分预期,利好早已经打入估值。广告陷痛苦转型期:转型的阵痛开始变得醒目,目前搜索结果中AI 生成内容的渗透率已经提高至64%。

    BIDU百度二季度业绩略超预期

    百度智慧云预期中高增长:云业务在当下是风口,高增长自然没得说。不过少了上季度的惊艳,二季度的27% 增长符合市场大部分预期,利好早已经打入估值。广告陷痛苦转型期:转型的阵痛开始变得醒目,目前搜索结果中AI 生成内容的渗透率已经提高至64%。

  • LABUBU泡泡瑪特2025年H1業績,利潤均超過了去年全年水平

    LABUBU泡泡玛特2025年H1业绩,利润均超过了去年全年水平

    THE MONSTERS 系列目前作为泡泡玛特的第一大IP,经过近一年的“狂飙”,目前销售占比已经接近35%,这还是在公司主动控货的情况下。这意味着明年在高基数的情况下,如果消费者对LABUBU 产生审美疲劳,对泡泡玛特整体的业绩冲击会比较大。

    LABUBU泡泡玛特2025年H1业绩,利润均超过了去年全年水平

    THE MONSTERS 系列目前作为泡泡玛特的第一大IP,经过近一年的“狂飙”,目前销售占比已经接近35%,这还是在公司主动控货的情况下。这意味着明年在高基数的情况下,如果消费者对LABUBU 产生审美疲劳,对泡泡玛特整体的业绩冲击会比较大。

  • 小米2025年第二季度財報,汽車業務毛利率繼續提升!

    小米2025年第二季度财报,汽车业务毛利率继续提升!

    小米公司本季度汽车出货量8.1 万台,单车均价进一步提升至25.3 万元。主要是受Ultra 车型等高价车型出货,结构性带动均价提升。本季度汽车业务毛利率继续提升至26.4%,再超市场预期23.5%,主要是受均价提升和规模效应的带动。

    小米2025年第二季度财报,汽车业务毛利率继续提升!

    小米公司本季度汽车出货量8.1 万台,单车均价进一步提升至25.3 万元。主要是受Ultra 车型等高价车型出货,结构性带动均价提升。本季度汽车业务毛利率继续提升至26.4%,再超市场预期23.5%,主要是受均价提升和规模效应的带动。

  • 本周資本市場推測9月降息的聲音越來越響亮

    本周资本市场推测9月降息的声音越来越响亮

    降息之路并非一帆风顺。市场时而充满期待,时而又因联准会未如预期行动而感到失望。然而,专家们仍认为利率走势有望保持在相对低位。随着通膨持续疲弱、劳动市场压力逐步显现,风险平衡正加速倾向降息。

    本周资本市场推测9月降息的声音越来越响亮

    降息之路并非一帆风顺。市场时而充满期待,时而又因联准会未如预期行动而感到失望。然而,专家们仍认为利率走势有望保持在相对低位。随着通膨持续疲弱、劳动市场压力逐步显现,风险平衡正加速倾向降息。

  • 美國政府正考慮入股英特爾,新模式或重塑全球芯片產業格局?

    美国政府正考虑入股英特尔,新模式或重塑全球芯片产业格局?

    美国政府正在与芯片制造商英特尔/Intel进行谈判,希望入股这家陷入困境的公司。随后该公司股价周四上涨7% 。这一消息的传出,标志着美国政府将自己置于关键产业核心的决心,并符合特朗普总统长期以来呼吁在美国本土生产更多芯片和高科技产品的政策主张。

    美国政府正考虑入股英特尔,新模式或重塑全球芯片产业格局?

    美国政府正在与芯片制造商英特尔/Intel进行谈判,希望入股这家陷入困境的公司。随后该公司股价周四上涨7% 。这一消息的传出,标志着美国政府将自己置于关键产业核心的决心,并符合特朗普总统长期以来呼吁在美国本土生产更多芯片和高科技产品的政策主张。

  • 中加貿易戰升級:中國對加拿大油菜籽徵收75.8%關稅

    中加贸易战升级:中国对加拿大油菜籽征收75.8%关税

    中加两国持续一年的贸易争端再次升级。中国于本周二宣布,将对从加拿大进口的“油菜籽/Canola”加征高达75.8%的临时反倾销税,此举是对去年加拿大对中国电动汽车征收关税的最新反制。这项突如其来的关税政策,立即在加拿大油籽市场引发剧烈震荡。

    中加贸易战升级:中国对加拿大油菜籽征收75.8%关税

    中加两国持续一年的贸易争端再次升级。中国于本周二宣布,将对从加拿大进口的“油菜籽/Canola”加征高达75.8%的临时反倾销税,此举是对去年加拿大对中国电动汽车征收关税的最新反制。这项突如其来的关税政策,立即在加拿大油籽市场引发剧烈震荡。

  • 騰訊2025年二季度業績,股王依舊穩得讓人安心

    腾讯2025年二季度业绩,股王依旧稳得让人安心

    腾讯毛利率主要是因为游戏、广告等本身高利润率的业务占比提升,聚焦长青游戏IP 开发的战略,也使得近两年新游的变现效率高于以往。而费用上,增长主要体现在由AI 带来的的服务器带宽、设备折旧上,以及研发人员的成本,但整体看均相对可控。

    腾讯2025年二季度业绩,股王依旧稳得让人安心

    腾讯毛利率主要是因为游戏、广告等本身高利润率的业务占比提升,聚焦长青游戏IP 开发的战略,也使得近两年新游的变现效率高于以往。而费用上,增长主要体现在由AI 带来的的服务器带宽、设备折旧上,以及研发人员的成本,但整体看均相对可控。

1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4