中國Monica團隊推出AI Agent “Manus”,或引領人工智能體新時代?

中国Monica团队推出AI Agent “Manus”,或引领人工智能体新时代?

發布日期:

狂呼科技 Convo Tech 科技 Tech


要点:
中国AI公司Monica团队推出的Manus,作为全球首款通用型AI智能体,突破了传统大模型的局限,展示了AI智能体在未来应用中的巨大潜力,引发业界对AI Agent领域的广泛期待。

在人工智能的快速发展中,AI产品逐渐走向了更加智能化、更加具备实际应用价值的方向。随着技术的突破和企业的创新,AI正不断从单一的语言模型走向更复杂的智能系统,能够理解并执行任务,甚至具备类似人类的思考和行动能力。

3月6日凌晨,中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus。据悉,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,显示其性能超越Open AI的同层次大模型。 Manus的重大创新,不仅为人们展示了AI智能体的未来潜力,也激起了业界对于这一领域突破的期待。

Manus:从思考到行动的AI Agent

近日,Manus推出预览版后,仅仅20小时便在网路上引起广泛关注。 “Manus”这一名称源自著名格言“Mens et Manus”,意指“心与手”。它是指一款连接思维和行动的通用人工智能体/AI Agent,不仅能思考、交付答案,还会交付结果。 Manus擅长处理生活和工作各项任务,让你即便在休息的时候它来完成一切。

什么是通用人工智能体/AI Agent?

简单理解就是更接近人类做事步骤的一款机器人。 Manus拥有广泛的应用范围,从制作定制的旅游指南到深入分析特斯拉的股票都能胜任。该团队指出,Manus在GAIA(评估通用人工智能助理解决现实问题的基准)上,在所有三个难度级别中都表现出色,超越了OpenAI等同级别的模型,取得了领先的成绩。

Manus和现有的ChatGPT、Deepseek这类的大模型有什么区别呢?

像ChatGPT和DeepSeek这样的大型语言模型/LLM,它们的核心优势是经过大规模文本数据训练后,具备了强大的语言理解和生成能力。它们能够根据用户输入的提示词生成连贯的文本,执行诸如问答、文本摘要和翻译等自然语言处理任务。然而,LLM本质上是模型,侧重于对语言的预测和生成,缺乏自主行动的能力。

而以Manus为代表的Agent的核心在于自主行动。它不仅能够理解语言,还能够感知环境、做出决策、执行动作,并与外部世界进行交互。 Manus作为agent,意味着它具备了自主规划和执行任务的能力。它能够根据用户指令调用外部工具和资源,完成复杂的任务。 Agent的重点在于“行动”,强调自主规划和计划实施。

而两者的结合,正是人工智能AI发展的趋势!

LLM可以作为Agent的“大脑”,为其提供语言理解和生成能力,而Agent则可以利用LLM的知识和推理能力更好地完成任务。例如,Agent可以利用LLM理解用户指令,然后调用搜索引擎和日历等工具完成预定会议或查询信息等任务。因此,LLM是Agent大脑的组成部分,而Agent是拥有行动能力的主体。 LLM侧重于语言处理,Agent侧重于自主行动,二者的结合将创造出更加智能和强大的AI系统。

在官方发布的视频中,分别介绍了三个Manus在实际使用场景中所完成的工作案例

第一个任务是筛选简历。从15份简历中,为强化学习算法工程师职位推荐合适的候选人,并根据他们在强化学习方面的专业知识对候选人进行排名。

在这个演示中,你甚至不需要手动解压压缩文件或逐一上传其中的简历。 Manus就像一个“实习生”,能够自动解压文件,逐页浏览每一份简历,并提取其中的重要信息。

Manus能够自动理解“解压老板扔过来的打包文件”这一隐性指令,展现出了类似人类实习生的能力。在Manus给出的结果中,不仅包含自动生成的排名建议,还会根据工作经验等关键维度,将候选人分为不同等级。若用户希望以Excel表格的方式展示结果,Manus还能自动通过编写Python脚本来生成相应的表格。

更令人惊讶的是,Manus具备记忆功能,它能在这个过程中记录下“用户更倾向于以表格形式接收结果”这一偏好,并在未来处理类似任务时,优先选择使用表格来呈现结果。

第二个案例是房产筛选。在这个案例中,用户希望在纽约购买房产,并提出了几个具体要求:希望所在社区安全、犯罪率低,且有优质的中小学教育资源。当然,最重要的还有预算,必须足够在每月固定收入的情况下负担得起。

Manus AI在处理这一需求时,将复杂的任务拆解为多个待办事项,包括研究安全社区、识别优质学校、计算预算、搜索房产等。它通过网络搜索,仔细阅读关于纽约最安全社区的文章,并收集相关信息。

接着,Manus编写了一个Python程序,根据用户的收入计算其可负担的房产预算。结合房地产网站上的房价信息,它根据预算范围筛选出符合条件的房产。

最后,Manus将所有收集到的信息整合起来,撰写了一份详细的报告,内容涵盖社区安全分析、学校质量评估、预算分析、推荐房产列表以及相关资源链接,这一切就像一个专业的房地产经纪人所做的工作一样。由于Manus完全基于用户利益进行操作,使用体验也显得格外出色。

在最后一个案例中,Manus展示了其强大的股票价格分析能力。任务是分析过去三年中,英伟达/Nvidia、迈威尔/Marvell Technology科技和台积电/TSMC三只股票价格之间的相关性。尽管这三支股票之间通常有较强的关联性,但对于新手用户来说,快速理清其中的因果关系可能并不容易。

Manus的操作就像一位真正的股票经纪人。它首先通过API访问雅虎金融等信息平台,获取股票历史数据,并交叉验证数据的准确性,避免单一数据源可能带来的误导,确保最终分析结果的可靠性。

在这个案例中,Manus运用了Python编程技能,进行数据分析和可视化,同时结合金融领域的专业工具,最终通过数据图表和详细分析报告向用户清晰地反馈了这些股票之间的因果关系,这就像是金融领域“实习生”在日常工作中做的任务。

此外,Manus官网还展示了十多个它可以应用的场景,例如帮助用户整理旅行行程、提供个性化的旅游路线推荐,甚至可以学习使用各种复杂工具,来高效地完成日常工作。

随着自主学习的加入,AI Agent的通用性得到大幅提升。在用户的实际测试中,Manus能够根据描述的视频画面内容,精准地跨越平台限制,找到某个特定抖音短视频的链接,这展现了其强大的信息处理能力。

突破传统“AI Agent”:模拟人类思考与执行的智能助手

从上述案例可以看出,Manus的真正优势并非传统意义上的“AI Agent”概念,而在于它能够“模拟人类的工作方式”。与单纯的“计算执行”不同,Manus的工作逻辑更接近于“思考并执行指令”。它并没有做出人类无法完成的任务,这也是为何一些体验过当前版本Manus的用户将其形容为“实习生”。

在Manus的官网上,展示了许多它能够完成的任务,其中有一个案例演示了如何在B2B业务中使用Manus,快速、精准地将订货需求与全球供应商匹配。在类似的需求场景中,平台通常会整合全球供应链企业信息,帮助用户完成供货商与需求方的匹配,这在行业内是一种常见做法。但在Manus的案例中,你会看到完全不同的操作方式。

Manus AI釆用了名为“Multiple Agent”的架构,运行在独立的虚拟机中。通过规划代理、执行代理和验证代理的协作机制,它极大地提高了处理复杂任务的效率,并通过并行计算大大缩短了响应时间。

在这一架构中,每个代理都基于独立的语言模型或强化学习模型,通过API或消息队列进行通信。每个任务都在沙盒环境中执行,避免互相干扰,并且能够支持云端扩展。每个独立模型都能够模拟人类处理任务的流程,比如先进行思考与规划,理解复杂的指令并拆解为可执行的步骤,然后调用合适的工具。

换句话说,Manus的多代理架构更像是由多个助理协作完成不同任务,它们负责资源检索、信息对接、有效性验证等,帮助你完成整个工作流程。这不仅像是一个“实习生”,更像是一个微缩版的“部门主管”。

在B2B业务的案例中,Manus通过网页爬虫技术及编写和执行代码的能力,能够在互联网中自动检索信息,依据用户需求,从产品质量、价格、交货能力等多个维度,为用户匹配最合适的供应商。这些信息不仅以图表的方式直观呈现,还能提供进一步的操作建议。

Manus的发布恰逢中国一系列新人工智能产品的推出,尤其是在今年早些时候,DeepSeek R1的发布引起了人们对中国人工智能能力的关注。 DeepSeek宣称其产品可以与OpenAI的GPT等竞争对手相媲美,且使用较旧的硬件和更低的预算。

Manus发布后,许多媒体将其称为“AI代理的'GPT 时刻'到来”,认为这一产品震撼了整个AI圈。然而,由于该产品釆用邀请码制度,并处于内测阶段,除了部分内测用户分享了Manus的实际使用案例外,大多数渴望体验的用户被“挡在门外”。

在一些二手交易平台,一个Manus内测的邀请码被炒到了5万元以上,但却有价无市。在A股市场,新开普、汉得信息、鼎捷数智等AI智能体概念股集体涨停,引发市场狂欢。

然而,引发关注的同时,由于Manus釆用邀请内测的限制,导致多数观众乃至于业内人士无法体验到这一款AI Agent带来的创新体验,这一举动也被业界质疑为“饥饿营销+套壳炒作”。许多媒体人士开始对该产品的真实效果提出疑问,指出,“Manus 这家公司似乎在市场营销上投入了大量资金,通过科技媒体和KOL的转发与点赞来炒作,宣称这是AI代理的'GPT 时刻',或是Agent的DeepSeek时刻,结果却发现创始人是连续创业者。”

但也有AI圈人士表示,“Manus的爆火,其实背后反映的是大众对于以Manus为代表的这一类AI Agent产品的期待,DeepSeek出圈后,中国对于AI大模型底层优化层面的信心逐渐恢复,各大厂商也纷纷接入了这一DeepSeek,在此基础上,下一个现象级的本土AI原生应用何时爆发,成为大家新的期待点,在一定程度上Manus的出圈,无论是营销还是产品形态上都满足了大家的这种期待,只是不知最终这款产品的表现能否达到大众的期待。”

迫于舆论压力,Manus AI合伙人张涛今天两次澄清“从未投入任何市场推广预算”,釆用邀请码机制是“服务器容量有限不得已而为之”。

此前,Manus出现之前,业内便已经纷纷预测,“2025年将成为AI Agent商业化应用元年。”DeepSeek爆火之后,其背后的V3、R1等多款AI大模型带来的工程优化和能力提升,快速引爆了市场热情,在此基础上,谁能基于这些模型能力打造出下一个超级App、超级Agent?成为大众关注的焦点。 Manus出圈背后,谁将成为下一个AI Agent的现象级产品,同样备受市场期待。

随着Manus的发布,我们正在见证人工智能从单纯的语言处理转向更加复杂的任务执行与自主行动的新时代。 Manus不仅仅是一个工具,它是一位能够自主思考并执行任务的“数字助理”,其通过不断学习与优化,逐步接近人类的工作方式,赋能我们更高效地完成日常事务。在这个智能化加速的时代,Manus或许正是未来AI Agent广泛普及的开始,它将重新定义我们与人工智能的关系,推动各行各业迈向更加智能、自动化的未来。

3月11日最新消息:
Manus官方微博宣布,与阿里Qwen通义千问团队正式达成策略合作。双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。目前两家技术团队已展开紧密协作,致力于为中国用户打造更具创造力的通用智能体产品。阿里巴巴的一位发言人证实了这项合作关系。发言人表示:“我们期待与更多全球人工智慧创新者合作。”

狂呼科技 Convo Tech

科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。

狂呼科技,研究,聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。

狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • PDD拼多多2026年第一季財報,不及市場預期

    PDD拼多多2026年第一季财报,不及市场预期

    因国内主站营收增长不及预期,营销支出也并未明显下滑,因此实际利润表现并不及预期。分板块来看背后原因,我们认为一方面是 Temu 本季减亏的幅度大概率并没有预期的那么多,另外国内主站的经营利润增长应当也相当有限。

    PDD拼多多2026年第一季财报,不及市场预期

    因国内主站营收增长不及预期,营销支出也并未明显下滑,因此实际利润表现并不及预期。分板块来看背后原因,我们认为一方面是 Temu 本季减亏的幅度大概率并没有预期的那么多,另外国内主站的经营利润增长应当也相当有限。

  • 小米2026年第一季度財報,主要受手機和汽車毛利率同比回落影響

    小米2026年第一季度财报,主要受手机和汽车毛利率同比回落影响

    小米本季度汽车业务毛利率下滑至 20.1%,接近市场预期(20.5%),主要是受均价下滑的影响,其中包含了小米对购置税进行补贴的影响,并在本季度销售了一部分的低价现车。由于毛利率再次回落,海豚君测算本季度小米汽车业务核心经营利润再度陷入亏损 31 亿元。

    小米2026年第一季度财报,主要受手机和汽车毛利率同比回落影响

    小米本季度汽车业务毛利率下滑至 20.1%,接近市场预期(20.5%),主要是受均价下滑的影响,其中包含了小米对购置税进行补贴的影响,并在本季度销售了一部分的低价现车。由于毛利率再次回落,海豚君测算本季度小米汽车业务核心经营利润再度陷入亏损 31 亿元。

  • NVDA英偉達2027財年第一季度財報,收入752億美元,環比增量為129億美元

    英伟达2027财年第一季度财报,收入752亿美元,环比增量为129亿美元

    NVDA核心经营指标:总收入816亿美元,好于上调后的买方预期(780-800亿美元),其中季度环比增长135亿美元,几乎都来自于数据中心业务中Blackwell量产增加的带动。

    英伟达2027财年第一季度财报,收入752亿美元,环比增量为129亿美元

    NVDA核心经营指标:总收入816亿美元,好于上调后的买方预期(780-800亿美元),其中季度环比增长135亿美元,几乎都来自于数据中心业务中Blackwell量产增加的带动。

  • BYD比亞迪2025年第四季度業績仍然不及預期,賣車單價仍處於下行軌道

    比亚迪2025年第四季度业绩仍然不及预期,卖车单价仍处于下行轨道

    比亚迪的业绩仍然不及预期。收入虽超预期,但主要由于非核心的比亚迪电子业务高增带来,而在核心的卖车业务上,卖车单价仍处于下行轨道,卖车成本降幅不够,最后卖车毛利率虽有回暖,但仍低于市场预期。

    比亚迪2025年第四季度业绩仍然不及预期,卖车单价仍处于下行轨道

    比亚迪的业绩仍然不及预期。收入虽超预期,但主要由于非核心的比亚迪电子业务高增带来,而在核心的卖车业务上,卖车单价仍处于下行轨道,卖车成本降幅不够,最后卖车毛利率虽有回暖,但仍低于市场预期。

  • GOOG谷歌TurboQuant新聞導緻MU美光科技等內存股股價暴跌,但這合理嗎?

    GOOG谷歌TurboQuant新闻导致MU美光科技等内存股股价暴跌,但这合理吗?

    消息一出,华尔街一度陷入恐慌:如果 AI 突然间不再需要那么多 RAM 就能运作,这是否意味着内存产业的“超级周期”即将结束?答案是否定的。事实上,从历史规律与经济学角度来看,情况正好相反。要理解这一点,我们只需要观察你电脑上的网页浏览器。

    GOOG谷歌TurboQuant新闻导致MU美光科技等内存股股价暴跌,但这合理吗?

    消息一出,华尔街一度陷入恐慌:如果 AI 突然间不再需要那么多 RAM 就能运作,这是否意味着内存产业的“超级周期”即将结束?答案是否定的。事实上,从历史规律与经济学角度来看,情况正好相反。要理解这一点,我们只需要观察你电脑上的网页浏览器。

  • BABA財報AI投入比較激進

    BABA财报AI投入比较激进

    BABA发布第四季财报后股价下跌,财报显示其营收和利润均大幅低于预期。这家電商巨头的季度净利暴跌67%,而总营收仅增长1.7%约413亿美元。这些表现引发了人们对阿里巴巴在AI人工智能领域巨额投资(总额超过530亿美元)有效性的担忧。

    BABA财报AI投入比较激进

    BABA发布第四季财报后股价下跌,财报显示其营收和利润均大幅低于预期。这家電商巨头的季度净利暴跌67%,而总营收仅增长1.7%约413亿美元。这些表现引发了人们对阿里巴巴在AI人工智能领域巨额投资(总额超过530亿美元)有效性的担忧。

  • MU美光業績,季度毛利率達到 74.4%!

    MU美光业绩,季度毛利率达到 74.4%!

    MU 整体业绩:美光本季度营收 238.6 亿美元,环比增长 75%,好于上调后的买方预期(199 亿美元),本季度收入增长主要来自于 DRAM 和 NAND 业务的双重带动,两大业务环增都在 70% 以上。

    MU美光业绩,季度毛利率达到 74.4%!

    MU 整体业绩:美光本季度营收 238.6 亿美元,环比增长 75%,好于上调后的买方预期(199 亿美元),本季度收入增长主要来自于 DRAM 和 NAND 业务的双重带动,两大业务环增都在 70% 以上。

  • Tencent騰訊業績整體看無驚無喜?

    腾讯业绩整体看无惊无喜?

    腾讯一口气连发多个“龙虾”产品,能够看出公司在元宝春节大战中失利后的焦虑,虽然仓促推出产品还不完善。不过这个紧迫感的转变很关键也很必要。就目前来看,微信入口似乎在 AI 原生应用盛行的当下仍然有无法撼动的地位。

    腾讯业绩整体看无惊无喜?

    腾讯一口气连发多个“龙虾”产品,能够看出公司在元宝春节大战中失利后的焦虑,虽然仓促推出产品还不完善。不过这个紧迫感的转变很关键也很必要。就目前来看,微信入口似乎在 AI 原生应用盛行的当下仍然有无法撼动的地位。

1 / 8
  • Sharpa機器人削蘋果

    Sharpa机器人削苹果

    对人类来说,削苹果是件轻而易举的晨间小事,但对机器人而言,这是双手协调能力的「终极挑战」。 Sharpa机器人正在为能够像人类一样灵巧地完成复杂家务和工业装配的机器人铺平道路。

    Sharpa机器人削苹果

    对人类来说,削苹果是件轻而易举的晨间小事,但对机器人而言,这是双手协调能力的「终极挑战」。 Sharpa机器人正在为能够像人类一样灵巧地完成复杂家务和工业装配的机器人铺平道路。

  • 腫瘤療法突破,中國團隊給癌細胞打上“豬”標簽,癌細胞“偽裝朮”被破解

    肿瘤疗法突破,中国团队给癌细胞打上“猪”标签,癌细胞“伪装术”被破解

    近期,中国科学家在“Cell”杂志上发表的一项突破性研究,为这一顽疾提供了全新思路。他们利用基因编辑技术,将癌细胞改造成免疫系统眼中的“异类”,类似于人体对猪器官产生的超急性排斥反应,从而引发了一场针对癌细胞的精准“免疫歼灭战”。

    肿瘤疗法突破,中国团队给癌细胞打上“猪”标签,癌细胞“伪装术”被破解

    近期,中国科学家在“Cell”杂志上发表的一项突破性研究,为这一顽疾提供了全新思路。他们利用基因编辑技术,将癌细胞改造成免疫系统眼中的“异类”,类似于人体对猪器官产生的超急性排斥反应,从而引发了一场针对癌细胞的精准“免疫歼灭战”。

  • 新型大腦設備首次讀出內心聲音,腦機接口技朮打破失語者困境

    新型大脑设备首次读出内心声音,脑机接口技术打破失语者困境

    新系统的核心原理与常见的“尝试说话”型脑机介面相似,都是在大脑运动皮质植入感测器,这一区域负责向声道肌肉下达运动指令。感测器捕捉到的神经活动会送入机器学习模型,模型依据个人化数据判断信号对应的声音,进而预测使用者想说的单字。

    新型大脑设备首次读出内心声音,脑机接口技术打破失语者困境

    新系统的核心原理与常见的“尝试说话”型脑机介面相似,都是在大脑运动皮质植入感测器,这一区域负责向声道肌肉下达运动指令。感测器捕捉到的神经活动会送入机器学习模型,模型依据个人化数据判断信号对应的声音,进而预测使用者想说的单字。

  • “垃圾DNA”新發現:遠古病毒DNA在人類發育中發揮關鍵作用

    “垃圾DNA”新发现:远古病毒DNA在人类发育中发挥关键作用

    自这类非编码DNA片段首次被发现并被称作“垃圾”以来,生物学家们一直在探讨它们是否真的无用。如今的主流观点认为,这些片段虽不直接参与蛋白质合成,却在整体基因组中占据了极大比例,显示它们可能具有重要功能。

    “垃圾DNA”新发现:远古病毒DNA在人类发育中发挥关键作用

    自这类非编码DNA片段首次被发现并被称作“垃圾”以来,生物学家们一直在探讨它们是否真的无用。如今的主流观点认为,这些片段虽不直接参与蛋白质合成,却在整体基因组中占据了极大比例,显示它们可能具有重要功能。

1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4