ChatGPT moment,图源:AI产品黄叔
第一个任务:Manus在收到用户发送的包含多份简历的压缩文件包后,解压文件,逐个浏览,给出排名建议,用户表示喜欢表格展示形式,Manus随即生成表格,同时因为具备学习能力,下次执行类似任务时Manus可直接交付表格。
第二个任务:Manus被要求对纽约的房产出具研究报告,Manus通过创建待办事项、搜索相关内容、阅读,选出安全社区,并结合周边学校情况,编写Python程序计算用户所需的预算,根据预算筛选出最适合用户的房产。
第三个任务,Manus被要求进行股票分析,Manus首先获取权威信息源,验证数据后编写程序进行数据分析和可视化操作,并根据用户交互的需求创建网站,交付可共享的链接。
Manus的诞生与定位
Manus 革命性体现
技术本质:套壳但非简单套壳
这里的”套壳”远非我们通常理解的那种简单API调用,不是给跑车换了个外壳,Manus是在跑车的基础上,重新设计了传动系统,优化了动力输出,并加装了全新的导航系统和智能驾驶辅助。
一位资深工程师评价道:”Manus的架构设计体现了对AI能力的深刻理解,它没有试图创造新轮子,而是把现有的轮子组装成了一辆前所未有的高性能赛车。”
Manus的技术架构
Claude的MCP协议应用与创新
Manus成功的第一大秘密,对Claude的多环境处理(MCP)协议的巧妙应用与创新。
MCP(Model Control Protocol)由 Anthropic 提出的标准化接口,虽然 Manus 内部不一定是使用 MCP 协议标准接口,但我们可以按照 MCP 的思路去理解它是如何驱动多个 Agent 协同的。
Claude模型在训练过程中已经掌握了大量常见的DOM(文档对象模型)和CMD(命令行)指令。Manus团队将Claude原本就具备但未被充分利用的能力发挥到了极致。
MCP模型上下文协议,图源:互联网
Manus系统中,AI可以自如地操作网页元素、执行系统命令、处理多模态信息,同时保持上下文的连贯性。不是简单的API调用,而是对模型能力的深度激发。Manus让Claude展现出了远超预期的能力。
- Resources:访问实时数据源
- Tools:调用外部功能和 API
- Prompts:预设工作流程模板
RL小模型的关键作用
如果说Claude的MCP协议是Manus的”肌肉”,那么其自研的强化学习(RL)小模型则是系统的”大脑”。
这个专用小模型负责系统中最关键的决策环节:意图识别、任务规划和工具调用。它就像一个经验丰富的项目经理,能够准确理解客户需求,将大型项目拆分为可执行的小任务,并为每个任务分配最合适的资源。
在任务初始化阶段,RL小模型能精准识别用户意图,并自动创建相应的环境。例如,当用户提出”帮我计划一次日本旅行”的请求时,小模型会立即提取关键词”japan-trip”,创建任务文件夹,启动docker容器,为后续执行做好准备。
强化学习基本概念| My Secret Rainbow,图源:互联网
昨天刚写了RL之父拿了24年的图灵奖
更关键的是,小模型会生成一个结构化的todo.md文档,详细列出所有需要完成的步骤。这个看似简单的文档,实际上是整个系统的”中央指挥台”,所有执行过程都围绕它展开。
引入RL小模型的另一个显著好处是大幅降低了对大模型的调用频率。通常情况下,大模型需要处理大量上下文信息才能做出决策,这不仅耗时还十分昂贵。而小模型专注于特定任务,运行效率更高,成本更低,是Manus能够将单任务成本控制在2美元的关键因素之一。
todo.md驱动的工作流程与工具包生态
用一个词来描述Manus的工作流程设计,那就是”优雅”。
在Manus系统中,todo.md文件作为核心上下文管理工具,扮演着至关重要的角色。它不只是一个简单的任务列表,而是整个系统的”记忆中枢”和”指挥中心”。
每一个待执行的任务都用”[ ]”标记,已完成的任务则更新为”[x]”。主线程不断检查todo.md的状态,将待执行任务交给相应的agent处理,然后更新任务状态。这种设计看似简单,却解决了AI Agent长期面临的上下文管理难题。
与此同时,Manus构建了一套丰富的工具包生态,使AI能够执行连接数据源、执行命令、创建编辑文件、搜索浏览网页等核心动作。这些工具就像AI的”手”和”脚”,让它能够与现实世界进行交互。
从回放记录中可以看到,Manus的AI能够熟练地在虚拟机上执行各种操作:从搜索引擎获取信息,浏览网页内容,捕获视觉信息,甚至进行编程和数据分析。这一切都围绕着todo.md进行组织和追踪,形成了一个高效、连贯的工作流程。
Less Structure, More Intelligence
“减少人工对AI的限制,让AI模型发挥作用,不要老想着让它做人。让它来教我们做人。”
这句来自Manus团队的原话,简洁而深刻地概括了他们的核心理念:Less Structure, More Intelligence(更少的结构,更多的智能)。
Hidecloud老师灵魂一指,图源:AI产品黄叔
传统的AI Agent开发思路往往是:设计一套严格的流程和规则,让AI按部就班地执行。这种方法就像是在训练一个听话的机器人,虽然可靠,但也极大限制了AI的潜力发挥。
Manus团队走了一条完全不同的路。他们认为,应该赋予AI更多自主权,让模型自己决定如何使用工具和完成任务。就像对待一个聪明的实习生,你不需要告诉他每一步该怎么做,只需要给他明确的目标、必要的资源,然后相信他能找到最佳方案。
这一理念在实践中取得了惊人的效果。用户报告说,Manus不仅能完成预定的任务,还能自主学习新技能,找到更高效的解决方案。例如,在观看YouTube视频时,它学会了使用快捷键来快进视频,大大提高了信息获取效率。
一位用户感叹道:”使用Manus就像雇佣了一个天才实习生,他不仅能完成你交代的任务,还会主动思考如何才能做得更好。”
这种”放手让AI自主发挥”的理念,看似简单,实则颠覆了传统AI应用的设计思路,是Manus成功的关键因素之一。
Manus团队与产品研发细节
Manus的成功,离不开其背后团队的卓越执行力和对产品细节的极致追求。
在AI技术日新月异的当下,时间就是一切。Manus团队深谙此道,他们敏锐把握了3个月这个关键的战略窗口期。正如团队内部所说:”大厂决策周期难以跟上AI领域变化,甚至一个OKR都长于技术变化周期。”
这种快速迭代的能力,是创业团队相对于大公司的核心优势。当大公司还在开会讨论要不要做某个功能时,Manus已经完成了三轮迭代,并根据用户反馈进行了多次优化。
这也是为什么是他们做出来Manus,图源:AI产品黄叔
团队的技术积累同样功不可没。Manus的创始团队此前在浏览器产品领域有深厚积累,开发了多项独家创新功能。这些经验为AI Agent与浏览器的深度融合奠定了基础,使”Give it a computer”这一理念得以实现。
有一个感人的小插曲:当Manus在GAIA指标上超越OpenAI DeepResearch的那个晚上,PeakJi和@hidecloud流泪了。
创始团队在为Manus命名时也颇费心思。据内部人士透露,他们曾考虑过”dodo.ai”这个名字,口号是”Just DODO it”,但最终选选择了”Manus”——这是拉丁语中”手”的意思,寓意AI成为用户的得力助手。这些细节反映了团队对产品的全方位思考。
Manus的商业价值重构:从DAU到AHPU
Manus不仅在技术上实现了突破,还重新定义了AI产品的价值衡量标准——从传统的日活用户(DAU)转向代理时间每用户(AHPU)。
Manus团队认为,对于AI Agent产品而言,DAU是一个过时的指标。未来衡量AI产品价值的核心不是”有多少人使用了它”,而是”它为用户节省了多少时间,完成了多少任务”。
AHPU(Agentic Hours Per User)这一新指标,精确衡量了用户委托AI完成任务的时间效率。如果一个用户通过AI在8小时内完成了相当于24小时的工作量,那么AHPU就是3。这才是AI真正创造价值的体现。
在成本控制方面,Manus同样表现出色。通过一系列技术优化(如KV cache优化、推理时延压缩、执行流程精简等),Manus将单任务成本控制在了惊人的2美元,远低于行业平均水平。
正如一位投资人所说:”Manus重新定义了AI的商业模式。它不是要占用用户的注意力,而是要替用户处理事务,释放注意力。这是一种全新的价值创造模式。”
展望:Manus开启的AI Agent元年
2025年,AI Agent的元年。
从ChatGPT到Claude再到如今的Manus,AI的竞争焦点正在从”思考”能力转向”行动”能力。不再是谁能回答得更好,而是谁能做得更多。
这一转变将带来巨大的产业影响。首先是推理算力需求的爆发性增长。与简单的聊天机器人相比,AI Agent对token的消耗是指数级的。有分析预测,未来一年推理需求将增长100-1000倍,这对不管是对NVIDIA、博通、海思、寒武纪、摩尔线程等知名企业,还是像瑞芯微、地平线、芯枥石这样的端侧AI芯片企业而言无疑是重大利好。
其次是用户与AI交互方式的根本变革。“劳动力扩展”( Scaling)将成为新范式,用户不再是AI的操作者,而是多个AI代理的”老板”或”指挥官”。正如Manus团队所说:”AI这个时代最挑战的是当老板的能力。我们只会当牛马。其实最考验的是怎么当老板。”
对模型公司而言,Manus的成功也将带来深刻思考。未来模型公司与应用公司的边界可能日益模糊,就像Claude CPO在访谈中提到的转型意向。模型公司可能会更多地参与到应用层面,而应用公司则会更多地影响模型的演进方向。
从技术角度看,代码优先策略(利用LLM原生编程能力)、多模态网页交互和动态学习机制将成为AI Agent的核心竞争点。Manus在这些方面已经先行一步,未来会有更多创新者加入这一赛道。
- 「数字分身」模式:学习你的思维习惯,替你在会议中发言
- 「AI监工」系统:自动跟踪项目进度,发现延迟直接拉群@责任人
- 「工具开发」功能:用自然语言创建专属工作流(“我要个自动追热点写公众号的流水线”)
一个本土团队的故事
肖弘,华中科技大学软件工程专业2015届校友,连续创业者,十余年技术创业经验的老将。早在校期间,他就展现出“折腾”精神,加入联创团队,带领团队推出志愿填报助手、咩咩、圈子集市等校园创新产品,为日后创业埋下伏笔。
第一战:夜莺科技——依附超级平台的商业验证
2015年毕业后,肖弘创立夜莺科技,专注于企业微信SaaS工具,推出了“微伴助手”“壹伴助手”,为企业提供高效的社交营销工具。这一模式不仅获得腾讯、真格基金等知名投资机构数亿元投资,还成功服务超200万B端用户,触达数亿C端用户。最终,该产品出售给明略科技。这一战役验证了“依附超级平台做垂直工具”的商业模式可行性,但也让肖弘意识到,技术创业的天花板并不止于此。
第二战:Monica——AI时代的新征程
2022年,ChatGPT的横空出世让肖弘敏锐捕捉到AI革命的风向。他随即成立“蝴蝶效应”公司,推出AI浏览器插件 Monica,主攻海外市场,意在避开国内巨头竞争,另辟蹊径。
Monica是一个 All-in-One 的AI助手,集成多个主流大模型,用户可以随时随地与其聊天、翻译、生成文案、作图等。它不仅是个浏览器插件,更是一个正在进化的 个性化AI助手,能帮助用户获取、处理和存储信息。肖弘的愿景很明确:让AI不仅仅是工具,而是每个人的智能伙伴。
在商业模式上,他不追求大模型的底层技术突破,而是借鉴苹果等消费电子公司的模式,通过 整合API+极致体验 实现差异化,重构应用层的价值。
2023年,Monica通过收购热门插件 “ChatGPT for Google” 迅速扩展用户规模。这款插件原本已积累300万用户,收购后,Monica构建起 AI工具矩阵,满足不同场景需求。这一策略不仅节省了产品研发周期,还验证了“工具全家桶”模式的市场价值。目前,Monica累计用户已突破 700万,稳居AI Chrome插件第一梯队。
2024年7月,肖弘携张涛 、首席科学家季逸超共同创立 Manus AI,继续探索AI的未来。
张涛曾在字节跳动负责国际化产品,随后在光年之外担任产品负责人。
季逸超,也是是一位备受瞩目的90后程序员和企业家。他在高中时期就读于北京大学附属中学,展现出对计算机编程的浓厚兴趣。在高二期间,他独立开发了“猛犸浏览器”(Mammoth),这款浏览器在苹果应用商店上线后,迅速获得了大量用户的青睐。截至2013年,猛犸浏览器已推出五个版本,下载量超过50万次,成为全球下载量最大的手机付费浏览器之一。
团队合影(右三为肖弘),图源:互联网
肖弘的产品哲学
肖弘的看法: “雕花”不是目的,用户体验才是”。他认为,无论是底层突破还是应用创新, 最终衡量标准只有一个——是否真正解决了用户问题。
在产品哲学上, Manus 进一步提出了 “less structure, more intelligence” 的设计理念。其核心观点是——“当你的数据足够优质、模型足够强大、架构足够灵活、工程足够扎实,AI能力将不再是一个功能,而是一种自然涌现的智能。”
这意味着, 未来的AI不再只是一个“工具”,而是一个“潜伏在后台的智能体”。例如,Manus支持 实时任务监控,你可以在移动端查看任务进展,而当你回来时,AI已经自动完成了你的需求。
这是一种 反直觉 的设计理念——用技术对抗技术,让AI技术变得“隐形”,从而让用户能专注于创造性工作。
最终,AI产品的演进方向可能不是 更多的按钮、更多的参数调整,而是 更少的干预、更直觉的体验。对于肖弘而言, “套壳”不是偷懒,而是高效利用资源,让技术真正服务用户。做到极致,“壳”也能成为核心竞争力。
肖弘的商业逻辑
大模型公司类似 芯片公司,专注于打造更优质、更具性价比的核心能力,而应用公司则更像 消费电子公司,通过品牌、渠道、交互体验来与用户建立更紧密的联系。换句话说, 苹果不会自己造芯片,但它依然是全球最成功的消费电子公司之一。
DeepSeek vs. Manus:中国AI的两条进化路径
梁文锋 代表了中国在大模型层的突破,犹如高举AI理想主义火炬的破壁者,冲击大模型的世界之巅,在算力、数据和算法上突破,打破以往头部企业巨头才玩得起的scaling law(规模定律)大力出奇迹的神话,影响了AI的发展方向;
肖弘 则化身技术现实主义的炼金术师——他不专注于构建大模型,而是巧妙地在现有技术框架内,打造更智能、更好用的AI产品,开辟了应用层的新赛道。
Manus能成为下一个DeepSeek一样的现象级产品吗?让子弹再飞一会。
Manus vs DeepSeek,图源:互联网
结语
Manus的横空出世,不仅仅是一个产品的成功,更是一个时代的开端。
AI的未来不在于模型有多大、参数有多少,而在于如何巧妙地组合现有技术,赋予AI真正的行动力。它不是要替代人类,而是要成为人类的得力助手,释放我们的创造力。
正如Manus团队所相信的:”Less Structure, More Intelligence“。有时候,放手让AI自由发挥,它会给我们带来惊喜。
这或许就是Manus能够成为第一个通用AI Agent的终极秘密:不是控制,而是赋能;不是限制,而是释放。
在这个AI Agent的元年,Manus为我们展示了一种可能性:未来的AI,将不再是被动的工具,而是主动的助手;不再只是回答问题,而是解决问题。Manus 的颠覆性不仅在于技术,更在于其构建的未来图景,开启 “数字分身” 新纪元。
- https://manus.im/share/Aa0M0gvOybi9cRwDK0RNpx?replay=1 ,写一本自定义主题的小说
- https://manus.im/share/hRGARE7EBqtDhLHBGISLP7?replay=1 ,财务估值模型搭建
- https://manus.im/share/Sc5a78DH57lQ5aYJbVAvZp?replay=1 ,泽连斯基的白宫互动游戏
- https://manus.im/share/cmRIphYJybxNiLSkWn6PJn?replay=1 ,谷歌CEO模拟器
了解 XLS 的更多信息
订阅后即可通过电子邮件收到最新文章。