智能摘要
Anthropic认为多数团队无需Multi-Agent系统,单个Agent通过优化提示可达到相近效果且成本更低。Multi-Agent仅适用于三种核心场景:子任务间信息干扰需做上下文隔离时、任务可拆分为多个独立方向并行探索时、以及单一Agent需管理过多工具导致选择准确率下降时。对于多数编码任务、简单查询或低价值任务,以及拟人化的角色分工模式,采用Multi-Agent架构反而会因协调开销和状态管理问题导致效率降低且成本剧增。
— 此摘要由AI生成仅供参考。
大多数团队不需要 Multi-Agent 系统。在单个 Agent 上反复改进 prompt,效果可匹配花数月搭建的复杂多 Agent 架构,且代价更低。普通 Agent 消耗约 4 倍于聊天的 token,而 Multi-Agent 系统消耗约 15 倍,额外开销来自跨 Agent 的上下文复制、协调消息和结果汇总,因此需任务价值足够高才能覆盖开销。
不同子任务积累的信息互相干扰导致推理质量下降时,用独立子 Agent 做上下文隔离。核心原则是通过通信共享上下文,而非通过共享上下文通信。对有明确输入输出的独立任务,启动全新子 Agent 只传入具体指令;仅当子 Agent 必须理解完整轨迹(如调试 Agent 需看到之前错误尝试)时才共享完整上下文。
任务可拆成多个独立方向同时推进时,Multi-Agent 效果显著。Anthropic 研究系统显示多 Agent 架构比单 Agent 高出 90%,因多 Agent 投入足够 token 解决问题,token 使用量解释 80% 的性能方差。例如 Claude 研究功能中,主 Agent 生成 3 到 5 个子 Agent,每个并行执行多个工具调用,复杂查询可减少 90% 研究时间。
当 Agent 需管理 20 个以上工具时,选择准确率明显下降;100 个以上工具会导致幻觉参数或调用错误。解决方案包括按领域拆分给专业化 Agent,或采用 Claude 的替代思路:用工具搜索工具,动态发现工具(Skill 渐进式加载),可减少 85% token 使用量。
编码子任务耦合度高,可并行化部分比研究类任务少,涉及 1 到 3 个文件修改时,单 Agent 更快更便宜。
Anthropic 缩放规则:简单事实核查只用 1 个 Agent(3 到 10 次工具调用),直接对比用 2 到 4 个子 Agent,仅复杂研究问题用 10 个以上子 Agent。早期版本曾出现对简单查询生成 50 个子 Agent 的失控情况。
不要按组织架构图排角色(如经理、设计师、程序员互相聊天)。应把子 Agent 当作工具调用,而非同事对话:主 Agent 调用函数,底层启动临时子 Agent 循环并返回结构化结果。按角色分工会产生持续协调开销。
多个子 Agent 做相同搜索时,任务指令必须包含目标、输出格式、工具范围和任务边界。Anthropic 早期因主 Agent 指令简短(如 “研究半导体短缺”),导致多个子 Agent 做完全相同的搜索。
OpenClaw 在同一会话内一次只处理一条消息,按会话序列化执行。因多个 Agent 共享状态时,并发会导致工具冲突和状态损坏,这是刻意设计选择而非限制。
原则:从最简单方案开始,仅在有明确证据时引入多 Agent。该用场景:上下文污染用隔离,并行探索用分发,工具过多用专业化。不该用情况:编码任务耦合度高,低价值查询不划算,拟人化角色分工是反模式。加分点:任务委派指令极其具体,共享状态时序列化比并行更安全。
文章评论