用户与 Agent 对话时序图

本文档展示了用户与 AI Agent 在不同交互场景下的完整时序流程，涵盖 6 个核心参与主体，并按照「计划生成 → 工具调用链路 → 结果生成与返回」三阶段进行拆解。参与主体 User（用户）：消息、语音、多模态输入的发起者 Agent（智能体工程）：编排、路由、决策的核心调度层 LLM（大模型）：意图识别、内容生成、语音合成等 AI 能力提供者 Agent Skills（技能系统）：封装特定领域能力的模块 MCP（中间层）：模型上下文协议，统一管理外部工具调用 Tools（外部工具）：各类第三方服务与 API…

2026年5月31日 53点热度 1人点赞阅读全文

Hermes 的多 Agents 是一套边界清晰的三层架构：第一层是执行内核：AIAgent。无论外部接入多少种形态的终端，最终负责思考和工具调度的，都是这套底层的运行核心。第二层是临时派生：delegate_task。它像是一个同步的方法调用，专门用来处理当前回合内的短任务和并发请求，即用即毁，不保留长期记忆。第三层是长效协作：Profile + Kanban。这套机制赋予了 Agent 持久的身份标识和跨节点的任务流转能力，用来支撑复杂的长期协同工程。要让这套三层架构顺畅运转，必须首先理清：状态究竟存储…

2026年5月15日 94点热度 0人点赞阅读全文

Multi-Agent 架构使用判断框架 Anthropic 的核心立场大多数团队不需要 Multi-Agent 系统。在单个 Agent 上反复改进 prompt，效果可匹配花数月搭建的复杂多 Agent 架构，且代价更低。普通 Agent 消耗约 4 倍于聊天的 token，而 Multi-Agent 系统消耗约 15 倍，额外开销来自跨 Agent 的上下文复制、协调消息和结果汇总，因此需任务价值足够高才能覆盖开销。该使用 Multi-Agent 的场景上下文污染不同子任务积累的信息互相干扰导致推理质…

2026年3月22日 337点热度 0人点赞阅读全文

上下文工程的本质大模型推理时的信息来源仅包括参数知识（训练阶段获得，推理阶段不可改）和上下文窗口内容。上下文工程本质是构建大模型的工作记忆，决定其决策时能看到的信息，进而影响行为质量。与 Prompt Engineering 的区别 Prompt Engineering：关注措辞、格式、few-shot 示例等 “怎么说” 的问题。上下文工程：关注每轮推理时上下文窗口中 “看到什么”，包括信息的选择、结构排列。核心差异：Agent 是多轮推理循环（典型任务平均调用 50 次工具），上下文信息不断累积，存在 …

2026年3月22日 323点热度 0人点赞阅读全文

行业现象：“套壳” 产品的意外成功 AI 行业存在 “做模型的看不起做应用的，做应用的看不起套壳的” 的鄙视链，但 2026 年出现两个纯套壳产品的成功案例：一个被 Meta 以 20 亿美元收购（Menace），另一个两周内获得 17 万 GitHub Stars（OpenClaw），引发行业对 “套壳” 认知的反思。案例介绍：两款典型 “套壳” 产品 Menace：2025 年 3 月发布，24 小时内成为国内 AI 领域讨论度最高产品，邀请码被炒至数万元。核心模型能力来自 Claude，通过调用 29 种工…

2026年3月22日 304点热度 0人点赞阅读全文

AGENT 的核心矛盾：灵活性 vs 确定性灵活性来源：模型自主决策，但天然带有不确定性，无法 100% 预测下一步行动。确定性来源：人定规则，但规则写死会丧失灵活性，无法应对未覆盖情况。关系：两者是跷跷板关系，无法同时最大化，多数 agent 项目失败源于未明确平衡点。编程 agent 成功的关键要素试错成本极低代码生成结果可通过执行即时验证，错误信息可被 agent 捕获并自主修正，反馈循环为毫秒级，无需人工判断。对比企业业务场景（如取消订单、发送邮件），试错成本极高，错误可能导致事故，无法通过多…

2026年3月22日 291点热度 0人点赞阅读全文

Agent 评测方法论 Agent 迭代中的问题常见问题：迭代后 Agent 出现 “降智” 现象，表现为能力退化或极端情况处理失败核心痛点：缺乏量化评测，导致迭代依赖直觉，问题发现滞后（如用户投诉后才察觉），陷入被动救火循环 Agent 评测的核心逻辑核心目标：将模糊的 Agent 表现转化为可信赖、可量化的数字评测与传统大模型评测的差异：Agent 涉及多轮交互（调用工具、修改状态、调整策略），单轮测试失效，中间环节错误易导致任务失败 Agent 评测的核心概念 Task（测试用例）：包含输入和成功标准…

2026年3月15日 307点热度 0人点赞阅读全文

Agent 记忆机制设计 ChatGPT 记忆机制的逆向发现通过对话实验逆向得出 ChatGPT 的记忆系统未使用向量数据库、RAG、embedding 召回及相似度匹配，而是采用 4 层纯结构化设计。尽管 ChatGPT 是对话产品而非 Agent，但其 memory 设计思路回答了 Agent 记忆系统的核心问题：何时该用检索，何时不该。不用向量数据库的核心原因精确调用需求：向量检索是模糊匹配，无法确保关键事实类信息的精准命中。例如用户预算等需精确读取的信息，结构化存储可直接查对应字段，避免歧义。时间处…

2026年3月15日 316点热度 0人点赞阅读全文

MCP 与 Skill 的区别及关系 MCP 与 Skill 的核心区别 Skill 定义能力：是一组预定义的指令和处理逻辑，告诉 AI 怎么做事，如按规范生成数据分析报告（先区域拆分、算同比环比、按模板输出），与数据来源无关 MCP 定义连接：是标准化开放协议，解决 agent 与外部系统（数据库、网盘、代码仓库等）的通信问题，负责打通通道，支持 agent 实时读取、操作外部资源，且持续在线类比：Skill 类似菜谱（记录做菜步骤），MCP 类似通向菜市场的路（食材通道），二者缺一不可为何 Skill 中加…

2026年3月15日 278点热度 0人点赞阅读全文

Function Calling 的底层机制 Function Calling 没有引入新的推理机制，底层与生成普通文本一致，均基于上下文的 next token prediction。模型通过训练学会在特定情况下将输出从自然语言切换为结构化 JSON 格式，而非存在独立的决策模块。关键在于模型通过大量样本学习输出模式，而非 “读懂”“判断” 或 “决定”。 Function Calling 的训练阶段分为监督微调（SFT）和强化学习两个阶段。SFT 阶段：训练数据包含大量工具调用完整对话链（系统提示工具信息→用…

2026年3月15日 296点热度 0人点赞阅读全文

用户与 Agent 对话时序图

Hermes 的多 Agents 是一套边界清晰的三层架构记录

Multi-Agent 架构使用判断框架

agent 上下文工程记录

mannus和openclaw的核心竞争力是什么？

AGENT 落地为什么是编程agent？的核心矛盾：灵活性 vs 确定性

Agent 评测方法论

Agent从理论到落地：记忆机制的设计

agent从理论到落地：MCP 与 Skill 的区别及关系理解

Agent 从理论到落地：大模型 Function Calling 底层原理与实现