5 个人三小时复刻开源版 Manus,邀请码也不需要

这壁垒…… 一夜走红的 Manus,现在已经有了开源复刻版!

5 个人 3 个小时,一个完全免费、无需排队等待的 OpenManus 就做好了。

至于复现程度,还是直接看 Manus 官方和开源团队提供的 demo 对比。

作为全球首款通用智能体,官方提供的 case 如下:

效果大家自己感受一下。

对于动手能力强的小伙伴儿,也期待大家自行体验后留言反馈。

从开源反推 Manus 的实现路径

与此同时,通过深扒 OpenManus,我们其实还可以看出一条实现 Manus 的合理路径。

(当前 Manus 使用了哪家模型、Agent 框架等具体细节处于保密状态)

概括而言,OpenManus 的背后有三大关键:

  • 拥有模块化 Agent 系统;

  • 具备实时反馈机制;

  • 配备了一整套强大的工具链;

展开来说,其核心设计就在这种模块化 Agent 系统。开发者可以根据需要自由组合不同的功能模块,从而创造出独特的 AI 助手。

在 OpenManus 中,拥有不同分工的 Agent 会协作完成需求理解、规划、行动等任务。

比如 Manus 主代理就像项目经理,负责理解用户需求并完成分工;PlanningAgent 作为规划员,负责将复杂任务进一步拆解成可执行的步骤;而 ToolCallAgent 则是技术专家,负责掌管各类工具使用。

以上这一套都是靠开源团队曾经提出的 MetaGPT(一个多智能体框架)实现,开发者可以自由集成多个合适的大语言模型。

此外,OpenManus 的另一关键在于其思维过程是公开透明的

正如开头提到的例子,拿到任务后,OpenManus 如何思考问题,如何规划执行…… 全都能实时反馈。

这为人类在合适时间进行干预提供了“窗口”,有助于更高质量完成任务。

最后不得不提到 Agent 对工具的使用。

为了完成复杂任务,OpenManus 也配备了一系列“外援”:

  • 浏览器自动化:像人类一样操作浏览器,自动分析网络信息并交互;

  • 各种代码执行器:能够实时生成和执行代码;

  • 文件处理:自动生成和管理各类文档;

  • ……

需要注意的是,各类工具都不是单独的模块,而是需要协同设计。

将以上组合在一起,这类多智能体系统的一般架构为:底层由各类大语言模型构成,中间层通过多智能体协作拆解任务,执行层调用各类 API 接口完成具体操作。

总之,按照 OpenManus 作者的总结,这一开源成果结合了 computer-use、基本的 Agents 以及融合了规划能力。

正如 OpenManus 团队在项目致谢中提到的,Claude 厂商 Anthropic 去年上线的 computer-use,以及 YC 投资的项目 browser-use,都给 OpenManus 提供了基础支持。

顾名思义,这两个项目分别被用来操作电脑和浏览器,而在沙盒环境中操纵正是 Manus 工作的一大核心特征。

5 人开发团队,3 小时完成复刻

OpenManus 团队只用了 1 个小时就完成了核心系统整体也只用了 3 个小时

核心作者梁新兵介绍,OpenManus 的火速上线,来源于 MetaGPT 积累下的技术沉淀。

(注:MetaGPT 是一个多智能体框架,为了处理复杂任务,将不同的角色分配给 GPT 模型,形成一个协作性“软件公司”。)

我们只是把浏览器工具链嫁接到过去代码上,配合沉淀的 Agent 工具包。

几位研发成员,也都是来自 MetaGPT 团队。

“开源版 Devin”—— 数据解释器(Data Interpreter),也是出自 MetaGPT 团队之手。

OpenManus 核心作者梁新兵,毕业于华东师大,还在读时就参与了 Data Interpreter 的工作。

另一名核心作者向劲宇,本科就读于西南交通大学应用物理系。

去年,读大四的他和队友一起使用 GPT-4 与 Claude 3 组成多智能体的方案,让 AI 分饰多个角色、相互验证来完成答题步骤,获得了阿里巴巴数学竞赛 AI 赛道全球第二名。

在 MetaGPT 社区,向劲宇还和其他成员一起,让智能体成功在“我的世界”当中采集到了钻石。

甚至他还曾经让智能体假扮知乎大 V,回答了 100 多个问题,获得 3 万余次阅读,还有赞同、反驳甚至私信关注,结果直到他主动停止,AI 的身份都未被发现。

张佳钇,去年本科毕业于中国人民大学高瓴人工智能学院,现在是港科大(广州)在读博士,被 ICLR 2025 接收的智能体框架 AFlow,他和向劲宇是共同一作。

于兆洋,张佳钇在人大的同级同学;洪思睿,MetaGPT 和 Data Interpreter 两篇论文的共同一作,DeepWisdom 高级研究员,香港科技大学硕士,本科毕业于暨南大学。

AFlow 的作者当中,也有于兆洋和洪思睿的名字。

今年,以张佳钇和向劲宇为共同一作,五个人的名字共同出现在了一个名为 SPO 的项目当中,该项目能够让提示词自我进化,让人们摆脱研究提示词工程的繁琐过程。

并且综合五名作者的经历和署名信息可以推断,除了 15 年取得硕士学位的洪思睿年龄稍长之外,其余 4 位作者,几乎都是本科毕业不久,当中有人选择继续深造,也有人加入了 DeepWisdom。

重新看 Manus“套壳风波”

除此之外,OpenManus 的出现,或许也给 Manus 的“套壳风波”提供了新的视角。

先简单回顾一下这场风波。

Manus 被质疑“套壳”主要源于两点:

一是有前车之鉴。Manus 背后团队曾打造出另一款产品 ——Monica,而作为一款集成各类大语言模型的插件,Monica 也曾一度陷入套壳争议。

所以对于一家公司出品的东西,大家很容易产生联想。

在此基础之上,由于产品被怀疑是套壳缝合而成,因此大家很容易形成 Manus 技术含量不高的印象。

然而,之所以说 OpenManus 是一个新视角,是因为从其复现路径来看,许多模块都是基于已有开源项目实现。

实现不同模块的统筹、调度,形成新的功能,绝非人人都有能力实现。

而且开源社区的一大意义,本就是让后来的开发者,能够直接站在巨人的肩膀上。

即使不谈开源,各大模型厂商提供 API 给开发者的目的,同样是让他们能够开发新的应用。

说得再夸张一些,引用 Perplexity 创始人的说法,“OpenAI 就是英伟达套壳,英伟达就是台积电套壳,台积电就是沙子套壳……”。

所以是否“套壳”,不是问题的核心,关键是它能不能产生实质性的生产力提升

但从我们昨天的实测感受来看,Manus 距离这一目标,还有相当长的距离。

所以,把产品的能力打磨好,可能才是比纠结套壳更要紧的事。

你对 Manus 的感受如何?欢迎评论区留言讨论。

开源地址:

https://github.com/mannaandpoem/OpenManus

参考链接:

  • [1]https://x.com/didiforx/status/1897675038972883408

  • [2]https://www.sohu.com/a/827134153_121798711

  • [3]https://modelscope.cn/studios/AI-ModelScope/SPO

本文来自微信公众号:量子位(ID:QbitAI),作者:克雷西、一水,原标题《5 个人三小时复刻开源版 Manus,邀请码也不需要了》

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注