中國Monica團隊推出AI Agent “Manus”,或引領人工智能體新時代?

中国Monica团队推出AI Agent “Manus”,或引领人工智能体新时代?

發布日期:

狂呼科技 Convo Tech 科技 Tech


要点:
中国AI公司Monica团队推出的Manus,作为全球首款通用型AI智能体,突破了传统大模型的局限,展示了AI智能体在未来应用中的巨大潜力,引发业界对AI Agent领域的广泛期待。

在人工智能的快速发展中,AI产品逐渐走向了更加智能化、更加具备实际应用价值的方向。随着技术的突破和企业的创新,AI正不断从单一的语言模型走向更复杂的智能系统,能够理解并执行任务,甚至具备类似人类的思考和行动能力。

3月6日凌晨,中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus。据悉,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,显示其性能超越Open AI的同层次大模型。 Manus的重大创新,不仅为人们展示了AI智能体的未来潜力,也激起了业界对于这一领域突破的期待。

Manus:从思考到行动的AI Agent

近日,Manus推出预览版后,仅仅20小时便在网路上引起广泛关注。 “Manus”这一名称源自著名格言“Mens et Manus”,意指“心与手”。它是指一款连接思维和行动的通用人工智能体/AI Agent,不仅能思考、交付答案,还会交付结果。 Manus擅长处理生活和工作各项任务,让你即便在休息的时候它来完成一切。

什么是通用人工智能体/AI Agent?

简单理解就是更接近人类做事步骤的一款机器人。 Manus拥有广泛的应用范围,从制作定制的旅游指南到深入分析特斯拉的股票都能胜任。该团队指出,Manus在GAIA(评估通用人工智能助理解决现实问题的基准)上,在所有三个难度级别中都表现出色,超越了OpenAI等同级别的模型,取得了领先的成绩。

Manus和现有的ChatGPT、Deepseek这类的大模型有什么区别呢?

像ChatGPT和DeepSeek这样的大型语言模型/LLM,它们的核心优势是经过大规模文本数据训练后,具备了强大的语言理解和生成能力。它们能够根据用户输入的提示词生成连贯的文本,执行诸如问答、文本摘要和翻译等自然语言处理任务。然而,LLM本质上是模型,侧重于对语言的预测和生成,缺乏自主行动的能力。

而以Manus为代表的Agent的核心在于自主行动。它不仅能够理解语言,还能够感知环境、做出决策、执行动作,并与外部世界进行交互。 Manus作为agent,意味着它具备了自主规划和执行任务的能力。它能够根据用户指令调用外部工具和资源,完成复杂的任务。 Agent的重点在于“行动”,强调自主规划和计划实施。

而两者的结合,正是人工智能AI发展的趋势!

LLM可以作为Agent的“大脑”,为其提供语言理解和生成能力,而Agent则可以利用LLM的知识和推理能力更好地完成任务。例如,Agent可以利用LLM理解用户指令,然后调用搜索引擎和日历等工具完成预定会议或查询信息等任务。因此,LLM是Agent大脑的组成部分,而Agent是拥有行动能力的主体。 LLM侧重于语言处理,Agent侧重于自主行动,二者的结合将创造出更加智能和强大的AI系统。

在官方发布的视频中,分别介绍了三个Manus在实际使用场景中所完成的工作案例

第一个任务是筛选简历。从15份简历中,为强化学习算法工程师职位推荐合适的候选人,并根据他们在强化学习方面的专业知识对候选人进行排名。

在这个演示中,你甚至不需要手动解压压缩文件或逐一上传其中的简历。 Manus就像一个“实习生”,能够自动解压文件,逐页浏览每一份简历,并提取其中的重要信息。

Manus能够自动理解“解压老板扔过来的打包文件”这一隐性指令,展现出了类似人类实习生的能力。在Manus给出的结果中,不仅包含自动生成的排名建议,还会根据工作经验等关键维度,将候选人分为不同等级。若用户希望以Excel表格的方式展示结果,Manus还能自动通过编写Python脚本来生成相应的表格。

更令人惊讶的是,Manus具备记忆功能,它能在这个过程中记录下“用户更倾向于以表格形式接收结果”这一偏好,并在未来处理类似任务时,优先选择使用表格来呈现结果。

第二个案例是房产筛选。在这个案例中,用户希望在纽约购买房产,并提出了几个具体要求:希望所在社区安全、犯罪率低,且有优质的中小学教育资源。当然,最重要的还有预算,必须足够在每月固定收入的情况下负担得起。

Manus AI在处理这一需求时,将复杂的任务拆解为多个待办事项,包括研究安全社区、识别优质学校、计算预算、搜索房产等。它通过网络搜索,仔细阅读关于纽约最安全社区的文章,并收集相关信息。

接着,Manus编写了一个Python程序,根据用户的收入计算其可负担的房产预算。结合房地产网站上的房价信息,它根据预算范围筛选出符合条件的房产。

最后,Manus将所有收集到的信息整合起来,撰写了一份详细的报告,内容涵盖社区安全分析、学校质量评估、预算分析、推荐房产列表以及相关资源链接,这一切就像一个专业的房地产经纪人所做的工作一样。由于Manus完全基于用户利益进行操作,使用体验也显得格外出色。

在最后一个案例中,Manus展示了其强大的股票价格分析能力。任务是分析过去三年中,英伟达/Nvidia、迈威尔/Marvell Technology科技和台积电/TSMC三只股票价格之间的相关性。尽管这三支股票之间通常有较强的关联性,但对于新手用户来说,快速理清其中的因果关系可能并不容易。

Manus的操作就像一位真正的股票经纪人。它首先通过API访问雅虎金融等信息平台,获取股票历史数据,并交叉验证数据的准确性,避免单一数据源可能带来的误导,确保最终分析结果的可靠性。

在这个案例中,Manus运用了Python编程技能,进行数据分析和可视化,同时结合金融领域的专业工具,最终通过数据图表和详细分析报告向用户清晰地反馈了这些股票之间的因果关系,这就像是金融领域“实习生”在日常工作中做的任务。

此外,Manus官网还展示了十多个它可以应用的场景,例如帮助用户整理旅行行程、提供个性化的旅游路线推荐,甚至可以学习使用各种复杂工具,来高效地完成日常工作。

随着自主学习的加入,AI Agent的通用性得到大幅提升。在用户的实际测试中,Manus能够根据描述的视频画面内容,精准地跨越平台限制,找到某个特定抖音短视频的链接,这展现了其强大的信息处理能力。

突破传统“AI Agent”:模拟人类思考与执行的智能助手

从上述案例可以看出,Manus的真正优势并非传统意义上的“AI Agent”概念,而在于它能够“模拟人类的工作方式”。与单纯的“计算执行”不同,Manus的工作逻辑更接近于“思考并执行指令”。它并没有做出人类无法完成的任务,这也是为何一些体验过当前版本Manus的用户将其形容为“实习生”。

在Manus的官网上,展示了许多它能够完成的任务,其中有一个案例演示了如何在B2B业务中使用Manus,快速、精准地将订货需求与全球供应商匹配。在类似的需求场景中,平台通常会整合全球供应链企业信息,帮助用户完成供货商与需求方的匹配,这在行业内是一种常见做法。但在Manus的案例中,你会看到完全不同的操作方式。

Manus AI釆用了名为“Multiple Agent”的架构,运行在独立的虚拟机中。通过规划代理、执行代理和验证代理的协作机制,它极大地提高了处理复杂任务的效率,并通过并行计算大大缩短了响应时间。

在这一架构中,每个代理都基于独立的语言模型或强化学习模型,通过API或消息队列进行通信。每个任务都在沙盒环境中执行,避免互相干扰,并且能够支持云端扩展。每个独立模型都能够模拟人类处理任务的流程,比如先进行思考与规划,理解复杂的指令并拆解为可执行的步骤,然后调用合适的工具。

换句话说,Manus的多代理架构更像是由多个助理协作完成不同任务,它们负责资源检索、信息对接、有效性验证等,帮助你完成整个工作流程。这不仅像是一个“实习生”,更像是一个微缩版的“部门主管”。

在B2B业务的案例中,Manus通过网页爬虫技术及编写和执行代码的能力,能够在互联网中自动检索信息,依据用户需求,从产品质量、价格、交货能力等多个维度,为用户匹配最合适的供应商。这些信息不仅以图表的方式直观呈现,还能提供进一步的操作建议。

Manus的发布恰逢中国一系列新人工智能产品的推出,尤其是在今年早些时候,DeepSeek R1的发布引起了人们对中国人工智能能力的关注。 DeepSeek宣称其产品可以与OpenAI的GPT等竞争对手相媲美,且使用较旧的硬件和更低的预算。

Manus发布后,许多媒体将其称为“AI代理的'GPT 时刻'到来”,认为这一产品震撼了整个AI圈。然而,由于该产品釆用邀请码制度,并处于内测阶段,除了部分内测用户分享了Manus的实际使用案例外,大多数渴望体验的用户被“挡在门外”。

在一些二手交易平台,一个Manus内测的邀请码被炒到了5万元以上,但却有价无市。在A股市场,新开普、汉得信息、鼎捷数智等AI智能体概念股集体涨停,引发市场狂欢。

然而,引发关注的同时,由于Manus釆用邀请内测的限制,导致多数观众乃至于业内人士无法体验到这一款AI Agent带来的创新体验,这一举动也被业界质疑为“饥饿营销+套壳炒作”。许多媒体人士开始对该产品的真实效果提出疑问,指出,“Manus 这家公司似乎在市场营销上投入了大量资金,通过科技媒体和KOL的转发与点赞来炒作,宣称这是AI代理的'GPT 时刻',或是Agent的DeepSeek时刻,结果却发现创始人是连续创业者。”

但也有AI圈人士表示,“Manus的爆火,其实背后反映的是大众对于以Manus为代表的这一类AI Agent产品的期待,DeepSeek出圈后,中国对于AI大模型底层优化层面的信心逐渐恢复,各大厂商也纷纷接入了这一DeepSeek,在此基础上,下一个现象级的本土AI原生应用何时爆发,成为大家新的期待点,在一定程度上Manus的出圈,无论是营销还是产品形态上都满足了大家的这种期待,只是不知最终这款产品的表现能否达到大众的期待。”

迫于舆论压力,Manus AI合伙人张涛今天两次澄清“从未投入任何市场推广预算”,釆用邀请码机制是“服务器容量有限不得已而为之”。

此前,Manus出现之前,业内便已经纷纷预测,“2025年将成为AI Agent商业化应用元年。”DeepSeek爆火之后,其背后的V3、R1等多款AI大模型带来的工程优化和能力提升,快速引爆了市场热情,在此基础上,谁能基于这些模型能力打造出下一个超级App、超级Agent?成为大众关注的焦点。 Manus出圈背后,谁将成为下一个AI Agent的现象级产品,同样备受市场期待。

随着Manus的发布,我们正在见证人工智能从单纯的语言处理转向更加复杂的任务执行与自主行动的新时代。 Manus不仅仅是一个工具,它是一位能够自主思考并执行任务的“数字助理”,其通过不断学习与优化,逐步接近人类的工作方式,赋能我们更高效地完成日常事务。在这个智能化加速的时代,Manus或许正是未来AI Agent广泛普及的开始,它将重新定义我们与人工智能的关系,推动各行各业迈向更加智能、自动化的未来。

3月11日最新消息:
Manus官方微博宣布,与阿里Qwen通义千问团队正式达成策略合作。双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。目前两家技术团队已展开紧密协作,致力于为中国用户打造更具创造力的通用智能体产品。阿里巴巴的一位发言人证实了这项合作关系。发言人表示:“我们期待与更多全球人工智慧创新者合作。”

狂呼科技 Convo Tech

科技正以前所未有的速度和規模發展,引發多個領域的變革,塑造了新的商業模式,甚至重塑了全新社會結構。我們一起,從科技創新中洞察社會轉型和升級的機遇。

狂呼科技,研究,聚焦科技創新對當今世界的影響,以獨特、前瞻的科技視角,洞察科技時代下涌現的“創新革命”。

狂呼,以最具突破性的技朮塑造我們的未來,為大眾捕捉科技商業先機,探索當今人類社會面臨的重大挑戰。

聯系我們 | 相關文章

免責聲明:本網站提供的信息僅供一般信息分享目的,並不應被視為投資建議。

返回博客
  • Plaud Note AI | 播客Podcast

    Plaud Note AI | 播客Podcast

    Plaud Note AI 技术:Plaud APP 整合先进的转录功能,支援112 种语言的快速准确转录。 AI 摘要功能基于GPT-5、Claude 4.0、o3-mini 和Gemini 2.5 Pro(Beta 版)开发,使用者可以建立摘要、会议记录和待办事项列表,从而提高日常工作效率。

    Plaud Note AI | 播客Podcast

    Plaud Note AI 技术:Plaud APP 整合先进的转录功能,支援112 种语言的快速准确转录。 AI 摘要功能基于GPT-5、Claude 4.0、o3-mini 和Gemini 2.5 Pro(Beta 版)开发,使用者可以建立摘要、会议记录和待办事项列表,从而提高日常工作效率。

  • Costco財報反映了美國中產的狀況

    Costco財報反映了美國中產的狀況

    雖然近幾個季度 Costco 的客單價(剔除匯率和油氣)並沒有明顯向上的趨勢,但似乎仍是體現出了消費者因價格走高,轉向更便宜的消費驅動的傾向。這一點從 Costco 自身更強的線上增長,以及偏弱的續費了也都有體現。

    Costco財報反映了美國中產的狀況

    雖然近幾個季度 Costco 的客單價(剔除匯率和油氣)並沒有明顯向上的趨勢,但似乎仍是體現出了消費者因價格走高,轉向更便宜的消費驅動的傾向。這一點從 Costco 自身更強的線上增長,以及偏弱的續費了也都有體現。

  • AI桌面寵物ROPET | 播客Podcast

    AI桌面宠物ROPET | 播客Podcast

    ROPET作为“桌面宠物”诞生,目标用户是25-40岁的女性。今年1月,ROPET在海外众筹网站上正式发行,在欧美国家售卖了1400台,目前正陆续交付;在日本、韩国和港台地区也已售出8000台左右。

    AI桌面宠物ROPET | 播客Podcast

    ROPET作为“桌面宠物”诞生,目标用户是25-40岁的女性。今年1月,ROPET在海外众筹网站上正式发行,在欧美国家售卖了1400台,目前正陆续交付;在日本、韩国和港台地区也已售出8000台左右。

  • NIO自4月低位股價翻倍,蔚來真能「重生」 嗎?

    NIO自4月低位股价翻倍,蔚来真能「重生」 吗?

    蔚来之后的爆品周期还能持续吗?这个问题是蔚来最为重要的问题。因为对大多数车企来看,真正大级别的机会都是产品、技术和组织等等问题梳理清楚之后,用一个新平台来推动一个较长时间的新车周期,新周期不是靠单一一款车的爆量,而是新平台下矩阵式的车型爆量。

    NIO自4月低位股价翻倍,蔚来真能「重生」 吗?

    蔚来之后的爆品周期还能持续吗?这个问题是蔚来最为重要的问题。因为对大多数车企来看,真正大级别的机会都是产品、技术和组织等等问题梳理清楚之后,用一个新平台来推动一个较长时间的新车周期,新周期不是靠单一一款车的爆量,而是新平台下矩阵式的车型爆量。

  • 美股、 港股及A股處於調整,調整後將再創高峰 | 視頻Video

    美股、 港股及A股处于调整,调整后将再创高峰 | 视频Video

    就业市场转弱,金融系统里面的流动性过剩几乎接近用尽,美联署9月份FOMC 应该减息,但市场可能很大程度上已反映减息一码(0.25%),FedWatch 显示机会率90% ,只减一码,未必有力再升,甚至到跌。

    美股、 港股及A股处于调整,调整后将再创高峰 | 视频Video

    就业市场转弱,金融系统里面的流动性过剩几乎接近用尽,美联署9月份FOMC 应该减息,但市场可能很大程度上已反映减息一码(0.25%),FedWatch 显示机会率90% ,只减一码,未必有力再升,甚至到跌。

  • 以色列科技創新,中國能學到什麼?硬科技VC的十年復盤 | 播客Podcast

    以色列科技创新,中国能学到什么?硬科技VC的十年复盘| 播客Podcast

    对话非金融出身、无耀眼光环的理工科年轻人闯入VC行业,经过大浪淘沙,在整个中国VC行业经历巨大转变之际,仍然活在牌桌上。其中,既有硬科技领域的扎实累积、方​​法论,也能看出,他们充分利用了中国市场和人才。

    以色列科技创新,中国能学到什么?硬科技VC的十年复盘| 播客Podcast

    对话非金融出身、无耀眼光环的理工科年轻人闯入VC行业,经过大浪淘沙,在整个中国VC行业经历巨大转变之际,仍然活在牌桌上。其中,既有硬科技领域的扎实累积、方​​法论,也能看出,他们充分利用了中国市场和人才。

  • LULU財報營收不及市場預期,表現讓人失望!

    LULU财报营收不及市场预期,表现让人失望!

    整体上,不达预期的二季度业绩加上再次下修的全年指引,使得公司盘后估计再次暴跌15% 以上,核心还是在于无论是本季度的业绩,还是公司对未来的指引,非但没有成长性的边际好转反而还在恶化,没季财报噩耗连珠,因此只能继续杀估值。

    LULU财报营收不及市场预期,表现让人失望!

    整体上,不达预期的二季度业绩加上再次下修的全年指引,使得公司盘后估计再次暴跌15% 以上,核心还是在于无论是本季度的业绩,还是公司对未来的指引,非但没有成长性的边际好转反而还在恶化,没季财报噩耗连珠,因此只能继续杀估值。

  • 對話前OpenAI科學家:GPT-5能獲得奧賽金牌,但那可能具有欺騙性? | 播客Podcast

    对话前OpenAI科学家:GPT-5能获得奥赛金牌,但那可能具有欺骗性? | 播客Podcast

    对话OpenAI 的两位前科学家:Kenneth Stanley和Joel Lehman;他们曾亲历前ChatGPT 时代的OpenAI,也是《为什么伟大不能被计划》一书的作者。 2023 年,这本书曾在中国科技圈掀起阅读的趋势。那正是ChatGPT 席卷全球、掀开大模型浪潮的一年。

    对话前OpenAI科学家:GPT-5能获得奥赛金牌,但那可能具有欺骗性? | 播客Podcast

    对话OpenAI 的两位前科学家:Kenneth Stanley和Joel Lehman;他们曾亲历前ChatGPT 时代的OpenAI,也是《为什么伟大不能被计划》一书的作者。 2023 年,这本书曾在中国科技圈掀起阅读的趋势。那正是ChatGPT 席卷全球、掀开大模型浪潮的一年。

1 / 8
1 / 4
1 / 4
  • 從中國經濟看背後困境及發展新構想?

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

    从中国经济看背后困境及发展新构想?

    中国未来发展或许可以参考“五环构想”进行战略布局。这一构想包括高等教育培训、创新科技驱动、产品生产销售、市场推广营销、出海战略布局五大领域。通过“五环构想”的实施,中国经济可能有一个全新的契机注入新的动力,推动经济稳定健康发展。

  • 在變革中的抉擇:當今大環境下如何實現職業規劃與人生價值?

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

    在变革中的抉择:当今大环境下如何实现职业规划与人生价值?

    随着时代的变迁,人生价值的内涵也变得更加多样化和个性化。每个人对于“成功”和“幸福”的理解不同,有些人追求的是即时的快乐和成就感,而有些人则看重长期的进步和自我超越。

  • 再見愛人:探索現代婚姻中的情感困境

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

    再见爱人:探索现代婚姻中的情感困境

    芒果TV婚姻纪实观察节目“再见爱人4”邀请黄圣依、杨子,麦琳、李行亮,葛夕、刘爽三对情感关系10年以上的夫妻,以“婚姻纪实观察”为切口,呈现出不同婚姻样本在亲密关系中的挣扎与甜蜜、桎梏与觉醒。

  • 抖音短劇新風潮:中老年人成為新的增長點?

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

    抖音短剧新风潮:中老年人成为新的增长点?

    近日,不少以老年人为主角的抖音短剧“闪婚五十岁”、“金榜题名之母凭子贵”、“人到五十,闪婚霸总”等等登上热度榜单。老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。

1 / 4