要点:
中国AI公司Monica团队推出的Manus,作为全球首款通用型AI智能体,突破了传统大模型的局限,展示了AI智能体在未来应用中的巨大潜力,引发业界对AI Agent领域的广泛期待。
在人工智能的快速发展中,AI产品逐渐走向了更加智能化、更加具备实际应用价值的方向。随着技术的突破和企业的创新,AI正不断从单一的语言模型走向更复杂的智能系统,能够理解并执行任务,甚至具备类似人类的思考和行动能力。
3月6日凌晨,中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus。据悉,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,显示其性能超越Open AI的同层次大模型。 Manus的重大创新,不仅为人们展示了AI智能体的未来潜力,也激起了业界对于这一领域突破的期待。
Manus:从思考到行动的AI Agent
近日,Manus推出预览版后,仅仅20小时便在网路上引起广泛关注。 “Manus”这一名称源自著名格言“Mens et Manus”,意指“心与手”。它是指一款连接思维和行动的通用人工智能体/AI Agent,不仅能思考、交付答案,还会交付结果。 Manus擅长处理生活和工作各项任务,让你即便在休息的时候它来完成一切。
什么是通用人工智能体/AI Agent?
简单理解就是更接近人类做事步骤的一款机器人。 Manus拥有广泛的应用范围,从制作定制的旅游指南到深入分析特斯拉的股票都能胜任。该团队指出,Manus在GAIA(评估通用人工智能助理解决现实问题的基准)上,在所有三个难度级别中都表现出色,超越了OpenAI等同级别的模型,取得了领先的成绩。
Manus和现有的ChatGPT、Deepseek这类的大模型有什么区别呢?
像ChatGPT和DeepSeek这样的大型语言模型/LLM,它们的核心优势是经过大规模文本数据训练后,具备了强大的语言理解和生成能力。它们能够根据用户输入的提示词生成连贯的文本,执行诸如问答、文本摘要和翻译等自然语言处理任务。然而,LLM本质上是模型,侧重于对语言的预测和生成,缺乏自主行动的能力。
而以Manus为代表的Agent的核心在于自主行动。它不仅能够理解语言,还能够感知环境、做出决策、执行动作,并与外部世界进行交互。 Manus作为agent,意味着它具备了自主规划和执行任务的能力。它能够根据用户指令调用外部工具和资源,完成复杂的任务。 Agent的重点在于“行动”,强调自主规划和计划实施。

而两者的结合,正是人工智能AI发展的趋势!
LLM可以作为Agent的“大脑”,为其提供语言理解和生成能力,而Agent则可以利用LLM的知识和推理能力更好地完成任务。例如,Agent可以利用LLM理解用户指令,然后调用搜索引擎和日历等工具完成预定会议或查询信息等任务。因此,LLM是Agent大脑的组成部分,而Agent是拥有行动能力的主体。 LLM侧重于语言处理,Agent侧重于自主行动,二者的结合将创造出更加智能和强大的AI系统。
在官方发布的视频中,分别介绍了三个Manus在实际使用场景中所完成的工作案例
第一个任务是筛选简历。从15份简历中,为强化学习算法工程师职位推荐合适的候选人,并根据他们在强化学习方面的专业知识对候选人进行排名。
在这个演示中,你甚至不需要手动解压压缩文件或逐一上传其中的简历。 Manus就像一个“实习生”,能够自动解压文件,逐页浏览每一份简历,并提取其中的重要信息。
Manus能够自动理解“解压老板扔过来的打包文件”这一隐性指令,展现出了类似人类实习生的能力。在Manus给出的结果中,不仅包含自动生成的排名建议,还会根据工作经验等关键维度,将候选人分为不同等级。若用户希望以Excel表格的方式展示结果,Manus还能自动通过编写Python脚本来生成相应的表格。
更令人惊讶的是,Manus具备记忆功能,它能在这个过程中记录下“用户更倾向于以表格形式接收结果”这一偏好,并在未来处理类似任务时,优先选择使用表格来呈现结果。
第二个案例是房产筛选。在这个案例中,用户希望在纽约购买房产,并提出了几个具体要求:希望所在社区安全、犯罪率低,且有优质的中小学教育资源。当然,最重要的还有预算,必须足够在每月固定收入的情况下负担得起。
Manus AI在处理这一需求时,将复杂的任务拆解为多个待办事项,包括研究安全社区、识别优质学校、计算预算、搜索房产等。它通过网络搜索,仔细阅读关于纽约最安全社区的文章,并收集相关信息。
接着,Manus编写了一个Python程序,根据用户的收入计算其可负担的房产预算。结合房地产网站上的房价信息,它根据预算范围筛选出符合条件的房产。
最后,Manus将所有收集到的信息整合起来,撰写了一份详细的报告,内容涵盖社区安全分析、学校质量评估、预算分析、推荐房产列表以及相关资源链接,这一切就像一个专业的房地产经纪人所做的工作一样。由于Manus完全基于用户利益进行操作,使用体验也显得格外出色。
在最后一个案例中,Manus展示了其强大的股票价格分析能力。任务是分析过去三年中,英伟达/Nvidia、迈威尔/Marvell Technology科技和台积电/TSMC三只股票价格之间的相关性。尽管这三支股票之间通常有较强的关联性,但对于新手用户来说,快速理清其中的因果关系可能并不容易。
Manus的操作就像一位真正的股票经纪人。它首先通过API访问雅虎金融等信息平台,获取股票历史数据,并交叉验证数据的准确性,避免单一数据源可能带来的误导,确保最终分析结果的可靠性。
在这个案例中,Manus运用了Python编程技能,进行数据分析和可视化,同时结合金融领域的专业工具,最终通过数据图表和详细分析报告向用户清晰地反馈了这些股票之间的因果关系,这就像是金融领域“实习生”在日常工作中做的任务。
此外,Manus官网还展示了十多个它可以应用的场景,例如帮助用户整理旅行行程、提供个性化的旅游路线推荐,甚至可以学习使用各种复杂工具,来高效地完成日常工作。
随着自主学习的加入,AI Agent的通用性得到大幅提升。在用户的实际测试中,Manus能够根据描述的视频画面内容,精准地跨越平台限制,找到某个特定抖音短视频的链接,这展现了其强大的信息处理能力。
突破传统“AI Agent”:模拟人类思考与执行的智能助手
从上述案例可以看出,Manus的真正优势并非传统意义上的“AI Agent”概念,而在于它能够“模拟人类的工作方式”。与单纯的“计算执行”不同,Manus的工作逻辑更接近于“思考并执行指令”。它并没有做出人类无法完成的任务,这也是为何一些体验过当前版本Manus的用户将其形容为“实习生”。
在Manus的官网上,展示了许多它能够完成的任务,其中有一个案例演示了如何在B2B业务中使用Manus,快速、精准地将订货需求与全球供应商匹配。在类似的需求场景中,平台通常会整合全球供应链企业信息,帮助用户完成供货商与需求方的匹配,这在行业内是一种常见做法。但在Manus的案例中,你会看到完全不同的操作方式。
Manus AI釆用了名为“Multiple Agent”的架构,运行在独立的虚拟机中。通过规划代理、执行代理和验证代理的协作机制,它极大地提高了处理复杂任务的效率,并通过并行计算大大缩短了响应时间。
在这一架构中,每个代理都基于独立的语言模型或强化学习模型,通过API或消息队列进行通信。每个任务都在沙盒环境中执行,避免互相干扰,并且能够支持云端扩展。每个独立模型都能够模拟人类处理任务的流程,比如先进行思考与规划,理解复杂的指令并拆解为可执行的步骤,然后调用合适的工具。
换句话说,Manus的多代理架构更像是由多个助理协作完成不同任务,它们负责资源检索、信息对接、有效性验证等,帮助你完成整个工作流程。这不仅像是一个“实习生”,更像是一个微缩版的“部门主管”。
在B2B业务的案例中,Manus通过网页爬虫技术及编写和执行代码的能力,能够在互联网中自动检索信息,依据用户需求,从产品质量、价格、交货能力等多个维度,为用户匹配最合适的供应商。这些信息不仅以图表的方式直观呈现,还能提供进一步的操作建议。
Manus的发布恰逢中国一系列新人工智能产品的推出,尤其是在今年早些时候,DeepSeek R1的发布引起了人们对中国人工智能能力的关注。 DeepSeek宣称其产品可以与OpenAI的GPT等竞争对手相媲美,且使用较旧的硬件和更低的预算。
Manus发布后,许多媒体将其称为“AI代理的'GPT 时刻'到来”,认为这一产品震撼了整个AI圈。然而,由于该产品釆用邀请码制度,并处于内测阶段,除了部分内测用户分享了Manus的实际使用案例外,大多数渴望体验的用户被“挡在门外”。
在一些二手交易平台,一个Manus内测的邀请码被炒到了5万元以上,但却有价无市。在A股市场,新开普、汉得信息、鼎捷数智等AI智能体概念股集体涨停,引发市场狂欢。
然而,引发关注的同时,由于Manus釆用邀请内测的限制,导致多数观众乃至于业内人士无法体验到这一款AI Agent带来的创新体验,这一举动也被业界质疑为“饥饿营销+套壳炒作”。许多媒体人士开始对该产品的真实效果提出疑问,指出,“Manus 这家公司似乎在市场营销上投入了大量资金,通过科技媒体和KOL的转发与点赞来炒作,宣称这是AI代理的'GPT 时刻',或是Agent的DeepSeek时刻,结果却发现创始人是连续创业者。”
但也有AI圈人士表示,“Manus的爆火,其实背后反映的是大众对于以Manus为代表的这一类AI Agent产品的期待,DeepSeek出圈后,中国对于AI大模型底层优化层面的信心逐渐恢复,各大厂商也纷纷接入了这一DeepSeek,在此基础上,下一个现象级的本土AI原生应用何时爆发,成为大家新的期待点,在一定程度上Manus的出圈,无论是营销还是产品形态上都满足了大家的这种期待,只是不知最终这款产品的表现能否达到大众的期待。”
迫于舆论压力,Manus AI合伙人张涛今天两次澄清“从未投入任何市场推广预算”,釆用邀请码机制是“服务器容量有限不得已而为之”。
此前,Manus出现之前,业内便已经纷纷预测,“2025年将成为AI Agent商业化应用元年。”DeepSeek爆火之后,其背后的V3、R1等多款AI大模型带来的工程优化和能力提升,快速引爆了市场热情,在此基础上,谁能基于这些模型能力打造出下一个超级App、超级Agent?成为大众关注的焦点。 Manus出圈背后,谁将成为下一个AI Agent的现象级产品,同样备受市场期待。
随着Manus的发布,我们正在见证人工智能从单纯的语言处理转向更加复杂的任务执行与自主行动的新时代。 Manus不仅仅是一个工具,它是一位能够自主思考并执行任务的“数字助理”,其通过不断学习与优化,逐步接近人类的工作方式,赋能我们更高效地完成日常事务。在这个智能化加速的时代,Manus或许正是未来AI Agent广泛普及的开始,它将重新定义我们与人工智能的关系,推动各行各业迈向更加智能、自动化的未来。
3月11日最新消息:
Manus官方微博宣布,与阿里Qwen通义千问团队正式达成策略合作。双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。目前两家技术团队已展开紧密协作,致力于为中国用户打造更具创造力的通用智能体产品。阿里巴巴的一位发言人证实了这项合作关系。发言人表示:“我们期待与更多全球人工智慧创新者合作。”
