这个中国 AI 产品一夜刷屏！全网都在要邀请码，可能是 DeepSeek 后最大惊喜

几乎在昨晚苹果发布新品的同时，整个科技圈却被一个名为 Manus 的产品刷屏了。

这是全球首款真正意义上的通用 AI Agent，从官网展示的案例可以看到，它能够独立思考、规划并执行复杂任务，直接交付完整成果。

比起 Claude 的 Computer use 等同样能操作多任务，或者能帮你点外卖订酒店的 Agent， Manus 可以覆盖更多领域和达成更高的执行质量。

Manus 在权威的 GAIA 基准测试中创下新纪录，性能远超 OpenAI 的同类产品。

而 Manus 这个名字来自拉丁语，Mens et Manus，就是 mind and hand，即手脑并用。这也是麻省理工学院的校训，以此鼓励学生将创意落地为实际成果。

创始人肖弘在 Manus 发布的前几个小时，在即刻平台上发文「高潮来临」，并分享了莎士比亚的一段书摘：

很难现在就判定 Manus 的诞生就是 AGI 的里程碑，但它很有可能将让 Agent （智能体）时代真的进入「高潮时刻」。

Manus 体验申请链接 👇：
https://manus.im/invitation

筛简历、选房炒股，Manus 真会「干活」？

官方宣称，Manus 不仅仅是一个只会聊天的对话式 AI 工具，而是一个真正的自主智能体（Agent）。

当其他 AI 可能只停留在生成想法的阶段，而 Manus 能够独立思考并采取行动。官方将其视为人机协作的新范式，甚至可能是通向 AGI 的一个窗口。

与 Manus 同步出圈的还有一段长达四分钟的演示 demo。在这些案例中，Manus 完全自主地完成从规划到执行的全流程，展示了真正的 Agent 能力，而非简单的助手功能。

比方说，首先从一个常见的人力资源任务——筛选简历开始。

演示一开始就放了个大招，官方向 Manus 发送了一个包含 10 份简历的压缩文件，Manus 能像专业招聘人员一样高效工作。

它会先解压文件，然后逐页浏览每份简历，并记录重要信息。Manus 还能异步处理文件，这意味着你可以随时关闭电脑，等任务完成后，它会通知你。

当然，在这个过程中，你也可以随时给它新的指令。

接着，继续向 Manus 上传 5 份简历。在认真阅读了所有 15 份简历后，Manus 给出了排名建议，并提供了候选人资料和评估标准作为参考。

这还没完，我们还可以让 Manus 生成电子表格。

由于 Manus 具有知识和记忆能力，所以下次执行类似任务时，它会直接以电子表格的形式交付结果。

另一个演示案例中，结合家庭收入情况和孩子的上学要求，让 Manus 在纽约筛选一个安全、犯罪率低的社区，并购买符合标准的房产。

面对这类复杂任务，Manus 同样是有条不紊地将其拆解为多个步骤，并创建详细的待办清单。

搜索并阅读关于纽约最安全社区的文章。
研究纽约的中学情况。
编写 Python 程序来计算预算。
基于预算，在房地产网站上筛选合适的房源。
整合所有信息，撰写详细报告并整理相关资料

转场到第三个案例，Manus 摇身一变成了专业的股票分析师。

让其分析英伟达、迈威尔科技，以及台积电在过去 3 年的股票价格之间的相关性，Manus 可以通过 API 访问权威数据源。在验证数据后，它开始编写用于数据分析和可视化的代码。

在完成数据分析和可视化后，Manus 也能基于这些数据创建一个网站。经用户的授权后，还能将网站部署至线上，并提供了一个可供分享的链接。

X 网友 @DavidAIinchina 也体验到了 Manus，并给出了极高的评价——「令人难以置信的用例」。

官方表示，以上展示的内容仅仅是 Manus 能力的冰山一角。

在用于评估通用 AI 助手在解决现实世界问题方面的能力的 GAIA 基准测试中，Manus 在所有三个难度级别上都达到了 SOTA 水平。

为了确保结果的可重复性，Manus 使用与其正式版本完全一致的配置进行评测。

除了基准测试，Manus 还在 Upwork 和 Fiverr 等平台上解决真实世界的问题，并在 Kaggle 竞赛中证明了自己的实力。

而这一切都离不开优秀的开源社区，因此官方也希望能回馈社区。

Manus 采用多重签名（multisig）系统，由多个独立模型驱动。今年晚些时候，官方将计划开源其中的一些模型，特别是 Manus的推理（postering）部分。

中国团队、两款爆品、百万用户

那么这款震撼业界的产品背后是谁？

据悉，Manus AI 背后的创始人肖弘是是华中科技大学软件工程专业 2015 届校友。

毕业后，他连续创业，2015 年创立夜莺科技，推出「壹伴助手」和「微伴助手」，服务超 200 万 B 端用户，获腾讯、真格基金等投资。

萦绕在肖弘身上的还有一个更鲜明的 AI 产品——Monica。

这是一款号称 All-in-One 的 AI 助手，最初以浏览器插件的形式推出。

通过集成主流大模型（如 Claude 3.5、DeepSeek 等），Monica 提供聊天、翻译、文案处理等功能，用户可通过自然语言创建定制化工具，并共享至工具广场。

Monica 同样是早期以海外市场为主，用户规模破百万，成为 AI 插件领域头部产品。

今年 2 月份，Monica 的中文版（monica.cn）已开启内测，目前免费向国内用户开放。该版本基于DeepSeek R1 和 V3 模型打造，具备深度推理思考能力，并支持记忆功能和实时联网搜索。

Manus 的技术哲学：less structure more intelligence

Manus 奉行的技术理念与主流也有些不同，是「less structure more intelligence.」（更少的结构，更多的智能）

他们认为，当数据足够优质、模型足够强大、架构足够灵活、工程足够扎实时，computer use、deep research、coding agent 等能力会自然涌现，无需被设计为特定的产品功能。

作为大力出奇迹的代表之一，GPT-4-Turbo 在 GAIA 公开排行榜上的平均成绩不到 7%，即使是使用复杂多智能体系统的解决方案也仅达到 40%。Manus 的表现可以说是「遥遥领先」。

创始人肖弘在最近在和张小珺的访谈中，他也提前谈到了当时还未发布的 Agent 产品 Manus 。

「看上去它确实应该就是一个 chatbot，这是很符合大家想象的，同时在应用侧却很复杂，和 Monica 不一样，光用好不同模型就挺复杂。」

肖弘还将目前 AI 应用分为两类：一是填补主要应用产品的空档的不足，二是为特定场景提供独特解决方案的应用，比如 Perplexity (提供联网搜索功能) 和 Monica (浏览器插件形态) 都属于此类，它们填补了现有产品留下的空白。

而模型驱动的新场景这类应用，主要出现在图片和视频领域，直接由模型技术的进步驱动。像 Pika 和 Runway 等产品利用模型能力创造了新的应用场景。

有用户调侃 Manus 是「极致的套壳就是牛逼」，实际上肖弘并不忌讳让用户知道自己的产品用的是别人的模型。早在去年，他就把 Monica 比作消费电子产品，并把 ChatGPT 的 Logo 打在官网。

人机交互新时代已来，但别急着把 Manus 捧上 AGI 神坛

APPSO 在 2024 年年初曾作出一个预测：大模型将成为智能手机新的操作系统，自然用户界面（Natural user interface， NUI ）将逐步替代现有的图形用户界面（GUI）。

而实现这种新交互的重要入口，就是 Agent 。

去年我们在很多手机的发布会上都看到类似的案例。 vivo 发布会展示可以 AI 订餐的「Phone GPT」，华为鸿蒙的小艺和意图框架，还是荣耀的 YOYO 智能体，以及智谱的 AutoGLM，核心都是一样的：

让 AI 模仿人类的 Plan-Do-Check-Act（计划-执行-检查-行动）循环，从而像人类那样去操作设备。

智谱 AI CEO 张鹏之前提到，目前的 Agent 能力更像是在用户和应用之间，增加一个智能的调度层，链接所有应用甚至是所有设备。

这可以看做是大模型通用操作系统 LLM-OS的一种雏形，将对人机交互形式产生极大的影响。OpenAI 创始成员、AI 技术大牛 Andrej Karpathy 也曾多次谈到大语言模型操作系统（LLM OS）。

他认为大模型某种程度来说就是一种新的计算机和操作系统，它可以连接各种软件和硬件，以及所有模态信息组成的外设，并通过函数调用执行各种任务。

传统操作系统中，你需要围绕 CPU 构建一堆外设，比如鼠标和键盘、磁盘存储、以及缓存空间等。

而在 LLM OS 中，大模型本身就是中央处理器。I/O 外设也不再是鼠标和键盘，因为 LLM 可以兼容更多模态的数据输入和输出。同时大模型调用的外部工具也将从传统软件升级为智能体工具。

其中跨应用的操作是非常关键的一环，这意味着 Agent 能实现更加复杂的自主连贯操作，也可能走向真正的商业化落地。至于各家互联网公司提供的服务能否打通，可能是未来实现这种交互最大的障碍。

不过现在很多 AI 助手实现代操作的方式，实际上是调用手机的无障碍功能 (accessibility features) 的权限，来控制屏幕点击。

Manus 的出现，意味着 Agent 模式下的 AI 能够理解需求后独立工作，直到任务完成。这无疑是人机交互领域的一大步，它让我们看到了 AI 从工具向伙伴转变的潜力。

但要说我们已经一只脚迈入了 AGI 大门，也还为时尚早。肖弘自己也提到，早期的 Agent 更像是「功能机」，需要不断迭代和完善。目前的 Agent 仍需依赖于模型能力的提升，以及更完善的虚拟环境支持，才能真正胜任各种长尾任务。

如果类比智能驾驶，大概也相当于从 L2 级升级到 L3 级的辅助驾驶。虽然 Manus 在 GAIA 基准测试中表现出色，但这并不意味着它已具备通用人工智能的全部特征。通往 AGI 的道路依然漫长，需要解决模型能力、自主学习、任务泛化等多重挑战。

但因为有了 Manus 在自主性与通用性上的突破，通往 AGI 的大航海中，又多了一颗照亮我们的星。

这个中国 AI 产品一夜刷屏！全网都在要邀请码，可能是 DeepSeek 后最大惊喜

筛简历、选房炒股，Manus 真会「干活」？

中国团队、两款爆品、百万用户

Manus 的技术哲学：less structure more intelligence

人机交互新时代已来，但别急着把 Manus 捧上 AGI 神坛

推荐文章

本篇来自栏目

早报|来自中国，全球第一款通用 AI Agent 产品亮相/微信上线存储「瘦身」功能/京东：将招聘 1 万名实习生

百度文库、网盘接入 DeepSeek，这才是学生党真正想要的 AI