‌Harness工程:Hermes-Agent 源码与架构分析报告

Hermes-Agent 源码架构分析报告 1. 项目总览指标数值 Python 文件总数（排除测试） 822 Python 代码总行数（排除测试） ~589,563 核心模块数 9 模型提供方（providers） 29 个插件目录内置技能（skills） 18 个分类目录可选技能（optional-skills） 19 个分类目录支持的消息平台 20+ 核心模块：agent / hermes_cli / plugins / gateway / tools / acp_adapter / tui_gat…

2026年6月28日 118点热度 0人点赞阅读全文

概述 ArkClaw 是火山引擎（字节跳动）于 2026 年 3 月推出的云 SaaS 版本，基于开源项目 OpenClaw（"龙虾"）构建。本报告从架构设计、安全体系、运行机制、多智能体、飞书集成及企业版等维度，全面剖析 ArkClaw 的技术内核。产品定位与核心架构 ArkClaw 采用 Gateway-Agent-Workspace 三层架构，是开源 OpenClaw 的云原生 SaaS 封装。 Gateway 网关层 Gateway 层是所有用户请求的入口，负责协议转换与消息路由，核心职责包括：协议转换…

2026年6月20日 142点热度 1人点赞阅读全文

Hermes Agent 核心策略全景 Hermes Agent 核心策略全景 1. 智能体分配策略策略类型触发条件关键参数行为描述用户视角触发例子子智能体委派模型调用 delegate_task 工具最大并发: 3, 深度: 1层, 迭代上限: 50 ThreadPoolExecutor 并行子 AIAgent，每个独立迭代预算，默认工具集 [terminal, file, web] 你说"帮我同时调研3个竞品"，助手派出3个小助手分头去查，各自独立工作后台审阅每回合结束后自动 spawn m…

2026年6月20日 137点热度 0人点赞阅读全文

本文档展示了用户与 AI Agent 在不同交互场景下的完整时序流程，涵盖 6 个核心参与主体，并按照「计划生成 → 工具调用链路 → 结果生成与返回」三阶段进行拆解。参与主体 User（用户）：消息、语音、多模态输入的发起者 Agent（智能体工程）：编排、路由、决策的核心调度层 LLM（大模型）：意图识别、内容生成、语音合成等 AI 能力提供者 Agent Skills（技能系统）：封装特定领域能力的模块 MCP（中间层）：模型上下文协议，统一管理外部工具调用 Tools（外部工具）：各类第三方服务与 API…

2026年5月31日 199点热度 1人点赞阅读全文

上下文工程的本质大模型推理时的信息来源仅包括参数知识（训练阶段获得，推理阶段不可改）和上下文窗口内容。上下文工程本质是构建大模型的工作记忆，决定其决策时能看到的信息，进而影响行为质量。与 Prompt Engineering 的区别 Prompt Engineering：关注措辞、格式、few-shot 示例等 “怎么说” 的问题。上下文工程：关注每轮推理时上下文窗口中 “看到什么”，包括信息的选择、结构排列。核心差异：Agent 是多轮推理循环（典型任务平均调用 50 次工具），上下文信息不断累积，存在 …

2026年3月22日 452点热度 0人点赞阅读全文

AGENT 的核心矛盾：灵活性 vs 确定性灵活性来源：模型自主决策，但天然带有不确定性，无法 100% 预测下一步行动。确定性来源：人定规则，但规则写死会丧失灵活性，无法应对未覆盖情况。关系：两者是跷跷板关系，无法同时最大化，多数 agent 项目失败源于未明确平衡点。编程 agent 成功的关键要素试错成本极低代码生成结果可通过执行即时验证，错误信息可被 agent 捕获并自主修正，反馈循环为毫秒级，无需人工判断。对比企业业务场景（如取消订单、发送邮件），试错成本极高，错误可能导致事故，无法通过多…

2026年3月22日 428点热度 0人点赞阅读全文

Agent 评测方法论 Agent 迭代中的问题常见问题：迭代后 Agent 出现 “降智” 现象，表现为能力退化或极端情况处理失败核心痛点：缺乏量化评测，导致迭代依赖直觉，问题发现滞后（如用户投诉后才察觉），陷入被动救火循环 Agent 评测的核心逻辑核心目标：将模糊的 Agent 表现转化为可信赖、可量化的数字评测与传统大模型评测的差异：Agent 涉及多轮交互（调用工具、修改状态、调整策略），单轮测试失效，中间环节错误易导致任务失败 Agent 评测的核心概念 Task（测试用例）：包含输入和成功标准…

2026年3月15日 430点热度 0人点赞阅读全文

Agent 记忆机制设计 ChatGPT 记忆机制的逆向发现通过对话实验逆向得出 ChatGPT 的记忆系统未使用向量数据库、RAG、embedding 召回及相似度匹配，而是采用 4 层纯结构化设计。尽管 ChatGPT 是对话产品而非 Agent，但其 memory 设计思路回答了 Agent 记忆系统的核心问题：何时该用检索，何时不该。不用向量数据库的核心原因精确调用需求：向量检索是模糊匹配，无法确保关键事实类信息的精准命中。例如用户预算等需精确读取的信息，结构化存储可直接查对应字段，避免歧义。时间处…

2026年3月15日 428点热度 0人点赞阅读全文

MCP 与 Skill 的区别及关系 MCP 与 Skill 的核心区别 Skill 定义能力：是一组预定义的指令和处理逻辑，告诉 AI 怎么做事，如按规范生成数据分析报告（先区域拆分、算同比环比、按模板输出），与数据来源无关 MCP 定义连接：是标准化开放协议，解决 agent 与外部系统（数据库、网盘、代码仓库等）的通信问题，负责打通通道，支持 agent 实时读取、操作外部资源，且持续在线类比：Skill 类似菜谱（记录做菜步骤），MCP 类似通向菜市场的路（食材通道），二者缺一不可为何 Skill 中加…

2026年3月15日 390点热度 0人点赞阅读全文

Agent Skills 概念介绍 Agent Skills（技能）是让 AI 像新员工一样被培训而非编程的概念。它本质是一个文件夹，包含核心的 skill MD 文件、配套脚本、资源和示例，如同为新员工准备的入职培训班，所有需学习的内容整齐存放其中。三层渐进式加载机制该机制的核心是渐进式披露：Level 1 仅加载 100 个 TOKEN，相当于只看目录；Level 2 读取完整的技能说明书；Level 3 则按需加载额外资源。这种按需加载方式可告别上下文爆炸，即使复杂技能包也能轻松驾驭，类似查字典时按需查阅…

2026年3月15日 431点热度 0人点赞阅读全文

‌Harness工程:Hermes-Agent 源码与架构分析报告

‌Harness 工程:火山引擎 ArkClaw 架构与运行机制研究

‌Harness 工程:Hermes为例 Agent 策略全景图与调用时序图

Agent架构流程:用户与 Agent 对话时序图

Agent上下文工程agent 上下文工程记录

AGENT 落地为什么是编程agent？的核心矛盾：灵活性 vs 确定性

Agent 评测方法论

Agent从理论到落地：记忆机制的设计

agent从理论到落地：MCP 与 Skill 的区别及关系理解

大模型从理论到落地:Agent Skills 概念介绍