2.1 一个类比讲清本质
5 min
“Claude、DeepSeek 这些大模型是大脑,OpenClaw 是身体。”
大脑什么都懂,但没有身体就被困在浏览器窗口里。OpenClaw 给它装上:
眼睛
浏览网页
读取文件
跑命令
发邮件
笔记本
持久记忆
不会忘
闹钟
定时醒来
主动干活
没有手脚不能执行操作,没有眼睛看不到你的文件系统,没有耳朵听不到飞书上的消息,没有记忆本关掉窗口就忘了之前说的。它被困在一个小房间里(浏览器窗口),只能跟你说话。OpenClaw 做的事,就是给这个大脑装上一个完整的身体。

ChatGPT / Claude 和 OpenClaw 不是竞争关系,是协作关系
OpenClaw 里面跑的就是 Claude / GPT / DeepSeek,它用它们当大脑,自己提供身体。
你不需要在”用 ChatGPT 还是用 OpenClaw”之间做选择,你可以同时用。

2.2 与 ChatGPT / Claude 的对比
5 min
维度 ChatGPT / Claude OpenClaw
本质 AI 大模型 编排层,用大模型作大脑
交互 浏览器 / App 飞书、Telegram、WhatsApp…
在线 关窗口就没了 7×24 不关机
能力 对话框说话 + 跑命令 + 发邮件 + 操作文件
记忆 对话结束即忘 文件持久保存
主动性 你问它才答 定时检查,主动汇报
数据 在它们服务器 在你自己机器上
费用 $20+/月订阅 软件免费,付 API 费
定制 一个文本框 整个文件系统 + git(代码版本管理工具)版本控制
很多人忽略的关键差异

ChatGPT 的自定义给你一个文本框写 system prompt(系统提示词),写完就是一个静态指令。OpenClaw 给你的是一整个文件系统:多个 Markdown(简单的文本标记格式)文件各司其职,可以随时编辑、版本控制、让 AI 自己更新。

比喻

“ChatGPT 的定制是写一份固定的说明书,OpenClaw 的定制是给 AI 一本不断更新的活笔记。”

2.3 六个核心概念
8 min · 重点
把 OpenClaw 想象成一家一人公司,AI 是唯一的员工:

① Gateway(网关)

公司前台
端口 18789
挂了=全面罢工

② Channels(消息通道)
沟通渠道
20+ 平台
国内推荐飞书
③ Skills(技能)
技能证书
ClawHub 13,700+
本质是 Markdown
④ Memory(记忆)
员工笔记本
MEMORY.md 持久
上下文↔文件调度
⑤ Heartbeat(心跳)
巡检制度
定时醒来检查
从被动→主动
⑥ Workspace(工作区)
灵魂四件套
AGENTS / SOUL
USER / MEMORY
Gateway(网关):跑在你机器上的服务程序,监听端口 18789,所有消息都经过它路由调度。它挂了 = 整个 AI”罢工”,什么消息都收不到,什么任务都执行不了。
Memory(记忆):把 LLM 的上下文窗口想象成电脑内存(RAM),把磁盘上的文件想象成硬盘。内存快但容量小(断电就没了),硬盘慢但永久保存。OpenClaw 不断在两者之间”调度”。
Heartbeat(心跳):这是从“被动”变”主动”的关键。设一个 HEARTBEAT.md 清单,AI 按时间间隔自己醒来检查 — 新邮件?HN(Hacker News,硅谷科技论坛)热帖?任务完成了?有情况就主动通知你。
Workspace(工作区):社区叫它 “Context Kernel”(上下文内核),每次 AI 开始新对话前都按固定流程加载 — 就像操作系统内核在任何程序运行前先加载一样。
邮件场景的四文件协作 ↓
你发一条”帮我写封邮件给客户”,AI 不只看到这 10 个字 — AGENTS.md 说”发邮件前必须确认”,SOUL.md 说”用简洁直接的风格”,USER.md 说”你是 AI 硬件产品经理”,MEMORY.md 说”上次这个客户关心交付时间”。同一句话,不同文件,完全不同的输出质量。
Workspace(工作区)展开:灵魂四件套
AGENTS.md → 员工手册(铁律)SOUL.md → 灵魂(可成长)USER.md → 你的画像MEMORY.md → 工作笔记
权限阶梯:AGENTS.md(人类锁定)> SOUL.md(AI 可改)> MEMORY.md(完全开放)
开机仪式:每次新对话启动时,AI 按固定流程加载文件 ↓

AGENTS.md

SOUL.md

USER.md

今天/昨天日记

MEMORY.md

准备就绪

你可以在 AGENTS.md 里自定义这个启动流程,让 AI 每次”上班”都先做你要求的检查。
核心洞察

“上下文 = 缓存,文件 = 真正的记忆。”

官方文档

“OpenClaw 的每一个行为都可以追溯到磁盘上的一个文件。”

文件 作用 关注度
AGENTS.md 操作规则(所有会话) ✅ 核心
SOUL.md AI 性格(主会话) ✅ 核心
USER.md 用户画像(主会话) ✅ 核心
MEMORY.md 永久记忆(主私聊) ✅ 核心
IDENTITY.md 防注入锚点 进阶
TOOLS.md 工具使用规则 进阶
HEARTBEAT.md 定时检查清单 进阶
BOOT.md 重启时执行 进阶
SHIELD.md 安全策略 进阶
memory/*.md 每日日志(自动写) 自动
skills/*.md 技能定义 按需
再多说两个你迟早会碰到的概念:
 ⑦ Tools(工具):瑞士军刀
OpenClaw 内置 25+ 个工具:翻出”命令行”就能执行代码,翻出”浏览器”就能自动登录网站、填表、截图。
浏览器自动化最惊喜 — AI 像真人一样操作浏览器:打开网页、登录、填表、点击、截图。
 ⑧ MCP:万能钥匙
MCP(Model Context Protocol)是 Anthropic 推的开放标准,像 USB 接口一样即插即用。
有了它,AI 不用为每个服务单独写适配器 — 连 Notion、数据库、Google Drive 即插即用。
起步阶段不用深究,知道有这个东西就行。
2.4 一条消息的旅程
2 min

你在手机打字

飞书传给OpenClaw ->Gateway路由->加载四文件+Skills->AI大脑决策->执行工具->整理答案->手机弹通知

Agentic Loop(代理循环)

AI 自己决定下一步做什么,可能搜天气、查日程、综合后再回复你。这种自主决策的循环就是 Agent 的核心。

2.5 三个核心原理:它为什么这样设计?
5 min · 进阶理解
了解完六个概念和消息流程,你可能会好奇:这些设计背后的原理是什么?
三个原理,用三个生活类比讲清楚。
 原理一:Agentic Loop(代理循环)
类比:像一个自驱型员工的工作方式
不是”你说一步我做一步”,而是”你说目标,我自己拆解、自己执行、自己检查”。
代理循环的工作方式 ↓

还没完成

完成了

接到任务

思考拆解

选择工具

执行操作

检查结果

最终回复

举个例子:你说”帮我查明天北京天气”
AI 可能自己循环三次:搜天气 → 发现你日程里明天有户外会议 → 综合建议你穿什么、带不带伞
核心区别

这就是 Agent(智能代理)和普通聊天机器人的本质区别。聊天机器人是”你问我答”,Agent 是”你给目标,我自己想办法达成”。

 原理二:双层记忆调度
类比:像人的大脑,工作记忆 vs 长期记忆
工作记忆(上下文窗口):容量有限,用完就忘,像你同时只能记住 7 个电话号码
长期记忆(磁盘文件):永久保存,但需要”回忆”过程,像你的笔记本,要翻才能看到
OpenClaw 的记忆调度流程 ↓

对话进行中

上下文快满了

触发 memoryFlush(记忆刷写)

AI 把重要信息写入文件

清理上下文

继续工作

生动比喻

“就像学生在下课铃响之前,赶紧把笔记抄完。”

这就是为什么你的 AI 不会失忆,今天聊的事,下周它还记得。因为重要信息都被”抄”到了 MEMORY.md 里。
 原理三:文件驱动架构
类比:像一家公司的制度手册,不是口头约定
核心设计哲学:OpenClaw 的每一个行为,都可以追溯到磁盘上的一个文件。
可追溯
AI 为什么这么做?打开文件就知道,不用猜
可版本控制
用 Git(版本管理工具)记录每次修改,随时可以”回滚”到之前的状态
可调试
输出不对?改文件就行,不用重新训练模型
对比 ChatGPT:它的行为藏在”黑箱”里,你不知道它为什么突然变了风格。OpenClaw 的一切行为都写在文件里,透明可控。
官方设计理念

“不是黑箱,不是玄学,它怎么做事,完全由你写在文件里的内容决定。”

该文观点仅代表作者本人,中视数字科技服务平台仅提供信息存储空间服务。