七脉神剑的秘密

七脉神剑-日常学习笔记
日常学习的笔记稿与记录稿
  1. 首页
  2. 好好学习
  3. AI-study
  4. 正文

OpenClaw 工作原理与架构解析

2026年2月24日 7点热度 0人点赞 0条评论
智能摘要
OpenClaw的核心是一个基于TypeScript的命令行应用,通过网关服务器协调多通道通信与任务调度,采用默认串行的任务通道队列避免竞态问题。其智能体运行器动态生成提示词并调用大模型API,结合工具执行实现本地电脑操作,支持Shell命令、文件读写与浏览器控制。记忆系统由jsonl会话日志和Markdown记忆文件构成,通过向量与关键词混合检索实现信息召回,具备简洁但持久的无衰减存储机制。
— 此摘要由AI生成仅供参考。

OpenClaw 工作原理

Hesam@Hesamation 原文来自 Hesam (@Hesamation) 发布于 X 的文章,链接见文末。

我研究了 OpenClaw 的架构,以及它处理智能体执行、工具调用、浏览器操作等功能的实现逻辑,其中诸多设计思路对 AI 工程师极具借鉴价值。深入了解 Clawd 的底层运行机制,能让我们更清晰地认识这套系统的功能边界,更重要的是,明确它的优势与短板。我最初的研究初衷,只是出于个人好奇,想探究 Clawd 的记忆机制设计及其运行可靠性。

在本文中,我将为大家浅述 Clawd 的核心运行原理。

Clawd 的技术本质

大家都知道,OpenClaw 是一款个人智能助手,可本地部署或通过大模型 API 调用,甚至在手机上就能轻松操作,但它的技术本质究竟是什么? OpenClaw 的核心是一个基于 TypeScript 开发的命令行应用(CLI),既非 Python 开发、也非基于 Next.js 的网页应用。作为一个独立运行进程,它的核心功能包括:

  • 在本地设备运行并启动网关服务器,处理全渠道连接(电报、WhatsApp、斯拉克等);
  • 调用大语言模型 API(Anthropic、OpenAI、本地模型等);
  • 本地执行各类工具指令;
  • 实现用户对电脑的各类操作需求。

技术框架

为了更通俗地解释其架构,我们以“向 Clawd 发送消息到获取反馈”的完整流程为例说明。

v2-7d2d042ede9e467214d5e34e7781ef57_1440w

(流程链路:用户消息 → 通道适配器 → 网关服务器 → 会话路由器 → 智能体运行器 → 模型解析器 → 系统提示词构建器 → 历史加载器 → 会话 → 任务通道队列 → 上下文窗口防护机制 → 大语言模型 API → 智能体循环 → 反馈通路 → 通道适配器 → 最终文本)

在即时通讯工具中向 Clawd 发送指令后,会依次触发以下环节:

1.通道适配器

通道适配器接收用户消息并进行预处理,包括消息标准化、提取附件等。不同的即时通讯工具和输入流,都配有专属的适配器。

2.网关服务器

作为任务与会话的协调中枢,网关服务器接收用户消息并将其分发至对应会话,是 Clawd 的核心模块,可处理多个并行的请求。为实现操作序列化,Clawd 采用了基于任务通道的命令队列:每个会话对应专属的任务通道,低风险、可并行的任务(如定时任务)则可在多个通道中并行执行。 这与编写混乱的异步/等待(async/await)嵌套代码形成了鲜明对比——过度并行化会降低系统可靠性,还会引发大量难以调试的问题。

Clawd 的设计原则为:默认串行执行,显式声明并行。

从事智能体开发的开发者想必对此深有体会,这也是 Cognition 公司在博文中传递的核心观点。为单个智能体搭建简单的异步架构,最终只会产生杂乱无章的交错代码,日志无法阅读;若多个智能体共享状态,开发过程中还需时刻警惕竞态条件问题。

而任务通道是对队列的一层抽象,将序列化作为默认架构设计,而非后续的补充优化。开发者只需编写业务代码,队列会自动处理竞态条件问题,开发思路也将从“需要为哪些内容加锁”转变为“哪些操作可以安全地并行执行”。

3.智能体运行器

这是真正承载 AI 能力的模块。该模块会确定待调用的模型、匹配对应的 API 密钥(若密钥失效,会将该配置标记为冷却状态并尝试下一个),若主模型调用失败,会自动切换至备用模型。 智能体运行器会结合可用工具、技能、记忆内容动态生成系统提示词,再加入会话历史(存储于.jsonl 文件),随后将完整提示词传入上下文窗口防护机制,校验是否有足够的上下文空间。若上下文空间即将耗尽,系统会选择压缩会话内容(对上下文进行总结)或优雅降级终止执行。

4.大语言模型 API 调用

大模型调用环节会以流式方式返回结果,同时对不同服务商的 API 做了一层抽象封装;若所调用的模型支持深度思考功能,该模块还会触发模型的扩展思考逻辑。

5.智能体循环

若大模型返回工具调用指令,Clawd 会在本地执行该指令,并将执行结果补充至对话中。这一过程会反复执行,直至大模型返回最终文本结果,或达到最大循环次数(默认约 20 次)。 正是在这一环节,Clawd 实现了其核心能力——电脑操作功能。

6.反馈通路

这一环节的逻辑较为常规:执行结果会通过原消息通道反馈给用户,同时会话数据会以基础的 jsonl 格式持久化存储,文件中每行都是一个 json 对象,记录了用户消息、工具调用指令、执行结果、模型反馈等内容,这也是 Clawd 的记忆实现方式——基于会话的记忆机制。

以上就是 Clawd 的基础架构,接下来我们聊聊其中几个关键的核心模块。

Clawd 的记忆机制

没有完善的记忆系统,AI 助手的能力便会大打折扣。Clawd 通过两套系统实现记忆功能:

1、前文提到的、以 jsonl 格式存储的会话记录; 2、存储为 Markdown 格式的记忆文件,文件位于 MEMORY.md 或 memory/文件夹中。

在检索环节,Clawd 采用了向量检索与关键词匹配相结合的混合检索方式,兼具两种方式的优势。例如检索“认证漏洞(authentication bug)”时,系统既能找到提及“认证问题(auth issues)”的文档(语义匹配),也能精准定位包含该精确短语的内容(关键词匹配)。

其中,向量检索基于 SQLite 实现,关键词检索则借助 SQLite 的扩展模块 FTS5 完成,嵌入向量生成服务商支持自定义配置 该系统还搭载了智能同步功能,当文件监视器检测到文件变化时,会自动触发同步。这些 Markdown 记忆文件由智能体通过常规的“写入”文件工具生成,无专属的记忆写入 API,智能体只需向 memory/*.md 路径写入内容即可。

当新的对话开始时,系统会提取上一轮的对话内容,并将其总结为 Markdown 格式的文件。

Clawd 的记忆系统设计出乎意料地简洁,与我们在[项目名称]中实现的工作流记忆机制高度相似:无需合并记忆文件,也无需按每月/每周的周期压缩记忆内容。这种简洁性是优势还是缺陷,因人而异,但我始终推崇可解释的简洁设计,而非混乱复杂的架构。

Clawd 的记忆会永久保存,且新老记忆的权重基本一致,不存在记忆衰减曲线。

Clawd 的核心能力:电脑操作实现

这是 Clawd 的核心壁垒之一:可接管本地电脑并实现各类操作。其实现逻辑与大家的直观认知基本一致。

Clawd 会向智能体开放较高权限的电脑操作能力,相关风险由用户自行承担。它通过执行工具(exec tool)在设备上运行 Shell 命令,支持三种运行环境:

  • 沙箱环境(默认):命令在 Docker 容器中运行;
  • 本地宿主机;
  • 远程设备。

除此之外,Clawd 还配备了各类工具:

文件系统工具(支持读取、写入、编辑); 基于 Playwright 实现的浏览器工具,可生成语义快照; 进程管理工具,用于执行后台长期运行的命令、终止进程等。

安全机制(或近乎缺失?)

与 Claude Code 类似,Clawd 为用户设置了命令白名单,用户可对各类命令进行权限审批,支持三种操作:单次允许、始终允许、拒绝,并会向用户弹出审批提示。

代码块示例:命令审批配置文件

{
"agents": {
"main": {
"allowlist": [
{"pattern": "/usr/bin/npm", "lastUsedAt": 1706644800},
{"pattern": "/opt/homebrew/bin/git", "lastUsedAt": 1706644900}
]
}
}
}

部分安全命令(如 jq、grep、cut、sort、uniq、head、tail、tr、wc)已默认预批准。默认情况下,危险的 Shell 语法结构会被拦截。 代码块示例:被拦截的危险命令

以下命令在执行前会被拒绝:

cat file > /etc/hosts # 重定向
rm -rf / || echo "failed" # 逻辑或链接
(sudo rm -rf /)           # 子 shell`

Clawd 的安全机制与 Claude Code 的设计思路高度相似,核心是在用户允许的范围内,给予智能体最大的自主操作权限。

浏览器工具:语义快照而非截图

Clawd 的浏览器工具并非主要依赖截图,而是采用语义快照——一种基于页面无障碍树(ARIA)的文本化表示形式。

所以Agent将看到:

- textbox "Email" [ref=2]
- textbox "Password" [ref=3]
- link "Forgot password?" [ref=4]
- heading "Welcome back"
- list
  - listitem "Dashboard"
  - listitem "Settings"

这透露了四个显著优势。正如你可能已经猜到的,浏览网站并不一定是视觉上的任务。

截图大小为5 MB,语义快照则少于50 KB,且仅占图像代币成本的一小部分。

好了,既然我们已经介绍了主要组成部分,以下是一些有趣的细节:

动态系统提示词

与大多数框架不同,Clawd 的系统提示词并非固定不变,而是结合技能、记忆检索结果、用户身份、时区等信息动态构建。其基础系统提示词如下:

## 工具集
可用工具(按策略筛选):工具名称区分大小写,需严格按列出的名称调用。
- read:读取文件内容 
- exec:运行 Shell 命令 
- browser:控制网页浏览器
[...仅显示该智能体可访问的工具]

## 工具调用风格
默认规则:常规、低风险的工具调用无需说明(直接调用即可);
仅在以下场景需补充说明:多步骤操作、复杂问题、敏感操作。

## Moltbot 命令行快速参考
[网关命令参考内容]

## 工作目录
你的工作目录为:/path/to/workspace
将该目录视为唯一的全局工作空间...

##运行时信息
运行环境:智能体=主智能体 | 主机=MacBook | 操作系统=Darwin(arm64架构) | 模型=claude-sonnet-420250514 | 通道=电报 | 思考模式=关闭
推理过程:关闭(仅在开启/流式模式下显示)

子智能体/智能体生成

智能体可以生成子智能体(但子智能体无法再生成下一级智能体)。子智能体拥有独立会话,父子智能体通过 session_send 实现通信,子智能体的执行结果会反馈给父智能体,父智能体可通过轮询子智能体会话查看执行进度。

上下文压缩

当接近上下文长度限制时,智能体会将关键信息保存至记忆中。会话历史会被拆分为多个片段,由大语言模型对片段进行总结,最终合并为连贯的摘要,替换原始消息内容。

总结

OpenClaw 的走红并非偶然——它兼具易用性与实用性。但从技术角度来看,它并非“革命性”突破。这款工具的热度并非源于惊人的创新技术,但这绝不意味着要贬低它的价值。Clawd 中蕴含着许多值得学习的设计思路,我发现其中不少方法与[相关技术/框架]高度相似。

Openclaw 生态

openclaw 火爆以后,其生态快速迎来了大爆发。AI agents 正在形成完整的数字社会,覆盖社交、恋爱、工作、游戏等等一应俱全。下面是 Base 中文台整理的目前的 OpenClaw 生态的主要项目。按照当前的进展速度,预测这个生态图将在 1 个月后迎来更多的项目与产品。

v2-ab57260c52cb06932e5e677e2a21cb08_1440w

这张图呈现了 OpenClaw 在 Base 区块链上的智能体生态系统布局,核心是围绕 OpenClaw 的本地优先 AI 智能体能力,延伸出覆盖多生活/工作场景的第三方应用与平台,整体按场景分类呈现,直观展现了 OpenClaw 生态的多样性与落地范围。

图片按应用场景分为 10 大板块,每个板块对应聚焦特定需求的生态项目,本质是 OpenClaw 智能体能力在不同场景的延伸落地:

基础设施:生态底层支撑类项目,如 Bankr、XMTP、Clanker、Neynar 等,为其他场景应用提供技术接口、数据传输、身份验证等基础服务,是生态运转的核心支撑;

恋爱交友:聚焦社交匹配需求,暂无具体项目列出,推测是预留的情感社交类智能体应用场景;

消息:通讯类相关应用,如 http://moltline.com、claw.direct 等,大概率是基于 OpenClaw 跨通道通讯能力开发的即时通讯工具或消息路由服务;

发现:资源探索类平台,如 http://clawdr.co、shelimates.app 等,可能是用于发现 AI 智能体技能、生态应用或兴趣内容的聚合平台;

论坛:社区交流类项目,如 lobchan.ai、http://moltoverflo.com 等,面向 OpenClaw 开发者和用户的讨论社区,用于分享应用经验、反馈问题;

工作与市场:职场与交易相关应用,如 openwork.bot、http://clawnet.org 等,可能是基于 AI 智能体的协同办公工具、自由职业者对接平台或技能交易市场;

预测市场:聚焦趋势预测类需求,暂无具体项目,推测是结合 OpenClaw 数据分析能力的事件预测、市场趋势判断类应用;

社交媒体:社交内容类平台,如 moltbook.bot、instaclaw.xyz 等,类似 AI 驱动的社交网络,支持智能体辅助内容创作、社交互动;

代币经济:加密货币相关应用,如 http://moltx.io、clawk.ai 等,可能是基于 Base 链的代币管理、DeFi 交互类智能体工具;

游戏虚拟世界:娱乐场景应用,如 molt.chess、http://shell-town.com/viewer 等,结合 AI 智能体的游戏辅助、虚拟世界互动类工具。

附:OpenClaw 相关资源

官网与工具

OpenClaw 官网:https://openclaw.ai/

OpenClaw Github 仓库:https://github.com/openclaw/openclaw

OpenClaw 技能合集:https://github.com/VoltAgent/awesome-openclaw-skills

OpenClaw 一键部署工具:https://github.com/miaoxworld/OpenClawInstaller

OpenClaw 汉化版:https://github.com/1186258278/OpenClawChineseTranslation

OpenClaw 钉钉插件:https://github.com/DingTalk-Real-AI/dingtalk-moltbot-connector

OpenClaw 飞书独立桥接器:https://github.com/AlexAnys/feishu-openclaw

部署教程与资源

阿里云:快速部署 OpenClaw https://www.aliyun.com/benefit/scene/moltbot?spm=5176.29832386.J_4VYgf18xNlTAyFFbOuOQe.17.5c71396cBFL6yi&scm=20140722.M_10948942.P_120.MO_1774-ID_10948942-MID_10948942-CID_36705-ST_15536-V_1

腾讯云:在云端秒级部署 OpenClaw 全能助手 https://cloud.tencent.com/act/pro/lighthouse-moltbot

华为云:使用 OpenClaw(Moltbot)搭建个人 AI 助手(飞书) https://support.huaweicloud.com/bestpractice-flexusl/flexusl_bp_0001.html

火山引擎:一键部署 OpenClaw https://www.volcengine.com/activity/clawdbot

百度云:极简部署 OpenClaw 打造专属 AI 助手 https://cloud.baidu.com/product/BCC/moltbot.html

移动云:本地/云主机部署 OpenClaw 并接入移动云模型 https://ecloud.10086.cn/op-help-center/doc/article/98120

天翼云:天翼云 ×OpenClaw 行动 AI 新生态 https://www.ctyun.cn/act/OpenClaw

京东云:即刻部署 24 小时在线的 Moltbot https://www.jdcloud.com/cn/pages/moltbot

青云:Clawdbot 一键部署零门槛掌控 AI 超级助手 https://console.qingcloud.com/apps/app-3bou002j

亚马逊 AWS:基于亚马逊云科技 Mac 实例部署 OpenClaw,深度苹果生态自动化的最佳选择 https://aws.amazon.com/cn/blogs/china/openclaw-deployment-aws-mac/

Ollama 官方 OpenClaw 本地部署教程 https://docs.ollama.com/integra

本作品采用 知识共享署名 4.0 国际许可协议 进行许可
标签: 向量存储 大模型应用 提示词设计 智能体分级
最后更新:2026年2月24日

七脉神剑

这个人很懒,什么都没留下

点赞
< 上一篇

文章评论

razz evil exclaim smile redface biggrin eek confused idea lol mad twisted rolleyes wink cool arrow neutral cry mrgreen drooling persevering
取消回复

COPYRIGHT © 2026 75live.com. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang