OPENCLAW_2026
MEMORY_
TOKEN_
CONTEXT_RUNBOOK.

// 痛点:OpenClaw 已能回复,但对话越长越慢、引用老结论、或升级后「像失忆」——根因往往在MEMORY.md 与 workspace 边界不清、检索策略把噪声当记忆、系统提示与工具返回把上下文撑爆三类问题叠在一起。结论:本文给出记忆分层对照矩阵五步落地、三条可引用阈值、Token 膨胀诊断阶梯,以及远程 Mac Gateway下状态目录与 launchd 环境对齐清单。结构:痛点|矩阵|步骤|阈值|排错|FAQ|深度观察|可观测性|评审证据|收束。延伸阅读:《迁移与 Gateway 重配对》《无回复与 doctor 排错》《Gateway 常驻与回滚》《MCP 与 Token 预算》《onboard 与常驻》《远程 Mac 部署》《套餐与节点》。

自动化代理与知识工作流概念示意

1. 痛点拆解:记忆不是「多写几段 Markdown」

(1)边界漂移:把运行日志、临时草稿与长期偏好全塞进 MEMORY.md,检索时会把过期假设当真理;而 workspace 里的业务文档若被误当「系统记忆」,又会污染人格层。(2)检索噪声:纯关键词或粗粒度分块会把相似措辞、不同决策混在一起,模型看起来「记得很多」实则召回的是错片段(3)Token 膨胀:系统提示、频道历史摘要、工具 JSON、MCP schema 与记忆片段同池竞争;你只盯着对话字数时,真正的爆点往往在隐藏前缀。升级后若 doctor 与 channels 正常仍变慢,优先做上下文审计而非换模型(参见《无回复排错》的诊断阶梯)。(4)远程路径与权限:Gateway 跑在远程 Mac 时,~/.openclaw 与 workspace 若与用户预期不一致,会出现「本机改完、线上没生效」的假失忆——与《迁移 Runbook》同类。

2. 记忆分层:写什么、不写什么

层级 建议承载 反模式
长期偏好 / 术语表 稳定事实、组织内专有名词、审批边界 把一次性任务结论当永久真理;不写版本与日期
项目 workspace 文档 可版本化的设计说明、接口契约、Runbook 把密钥、Cookie、Webhook secret 明文落盘
会话级 / 短期缓冲 当前线程目标、待确认问题、工具中间态 无限累积不裁剪,导致同一摘要重复注入

3. 落地五步走:把记忆变成可审计工程

  1. 写清 MEMORY 契约:规定哪些键/段落可自动写、哪些必须人工审;每条长期记忆带生效范围(频道/项目)与最后验证日期
  2. 固定检索入口:先过滤频道与目录,再向量/关键词;禁止「全库一把梭」作为默认路径。
  3. 摘要策略版本化:长会话滚动摘要要有代数与哈希,升级后对比是否重复注入旧摘要。
  4. 工具面收窄:MCP/Skills 只暴露当前任务需要的工具,降低 schema 与示例对前缀的占用(详见《MCP 与 Token》)。
  5. 远程环境对齐:launchd plist 中显式写入 HOMEPATH 与密钥引用路径;重启后跑一遍「记忆读写自检」脚本,确认与交互 shell 一致(参阅《onboard 与常驻》)。
# 心智模型:memory_record 建议字段(按你的栈调整) # { "scope": "channel:slack:xxx", "verified_at": "2026-04-11", # "source": "human|tool|import", "text": "...", "supersedes": "id或哈希" }

4. 可引用阈值(评审向)

可写进方案书的量级(需用你的日志复测):

  • 当单次请求里工具返回 + 记忆片段合计稳定超过约 8k tokens(依模型窗口调整)而 p95 延迟陡升时,应优先裁剪工具面或分段检索,而不是先加记忆条数。
  • 若滚动摘要每轮重复注入导致同一结论在上下文中出现 3 次以上,通常存在摘要去重缺失或两代摘要并存。
  • 团队每周在「记忆错乱 / 上下文爆炸 / 升级后失忆」上浪费超过3 小时,应把记忆治理与网关配置升格为发布门禁,而不是继续手工改 MEMORY。

5. Token 膨胀:诊断阶梯

阶梯 检查什么 常见根因
1)前缀剖面 系统提示、频道规则、固定免责声明各占比例 多频道策略复制粘贴导致重复块
2)工具与 MCP 单次调用返回体积、是否嵌套大 JSON 未分页、未字段投影、schema 过宽
3)记忆检索 Top-K 与片段最大长度 「多即是好」把低分片段也注入
4)会话摘要 摘要是否随轮次线性增长 无截断、无合并、无过期策略

6. FAQ:自改进、多频道与远程 Mac

问:自改进写入 MEMORY 要不要自动生效?建议默认人工闸门或「低影响自动 / 高影响待审」两档;否则错误会被固化成「组织记忆」。

问:多频道共用一份记忆吗?合规与噪声拆分:客户支持与内部研发不宜共用同一向量空间;至少做 scope 元数据过滤。

问:远程 Mac 上路径怎么验?Gateway 进程实际用户HOME 为准,而不是你 SSH 登录用户;不一致时表现为「文件在、读不到」。

问:升级后失忆?先比对状态目录与 workspace是否随 plist/容器变更;完整清单见《迁移》与《Gateway 回滚》。

7. 深度分析:从「能聊天」到「能运营」

2026 年代理栈的竞争点已从「能不能连上模型」转向记忆是否可审计、上下文是否可预测。企业内部署时,法务与安全会追问:哪些记忆是个人偏好、哪些是组织知识、是否可删除与可导出——若在设计阶段不把 scope 与保留期限写进契约,上线后只能打补丁式删文件。

工程上,记忆与 RAG 的边界越来越模糊:一边是 Markdown/笔记,一边是向量库。OpenClaw 用户常犯的错误是双写不同步——MEMORY 里改了结论,向量库未重建,检索仍拉回旧段落。评审应要求给出单一真源或明确的同步 Runbook。

远程 Mac 作为 7×24 Gateway 宿主机时,记忆治理还要叠加磁盘与备份:时间机器或快照策略是否包含 ~/.openclaw 与 workspace;恢复后是否要触发「记忆重建/重索引」——与《远程部署》中的稳定性章节同一逻辑。

与下游模型衔接时,要在网关层约定最大记忆条数、单条上限、失败降级(检索超时则只用会话摘要),使尾延迟可解释;否则运维会把一切慢都归因为「模型不行」。

8. 可观测性:把「偶发胡说」写成指标

建议在 runbook 固定:每轮注入的记忆条数与总 tokens检索空结果率工具返回 p95 体积摘要重写次数。四类同时恶化时优先怀疑配置漂移;仅延迟恶化而记忆条数稳定,优先怀疑工具/MCP 返回

观测项 采集方式 异常时优先怀疑
记忆注入 tokens 每请求结构化日志 Top-K 过大、片段过长、去重缺失
检索命中率 固定问题集小时回归 索引未更新、scope 过滤错误
工具返回体积 按工具名分位数 未分页、trace 级别日志进响应

9. 对内评审:你该索要的证据包

除截图外,应包含:MEMORY 契约版本检索参数表升级前后上下文剖面对比失败对话样本与期望记忆。没有失败样本的评审,往往在真实流量第一周被推翻。

10. 收束:本机联调轻快,生产要记住「可预测」

(1)当前方案限制:默认记忆策略易噪声化;工具与 MCP 易撑爆前缀;多频道与远程路径易漂移。

(2)为什么远程 Mac 常更省心:专用节点固定用户与 plist,睡眠策略与备份可统一;与本站其它 OpenClaw 教程同一 macOS 行为面。

(3)与 MACGPU 场景:若你希望低门槛试用常驻远程 Mac 跑 Gateway 并复用 Apple Silicon 工具链,而不是维护杂牌 VPS 环境,MACGPU 提供可租赁节点与帮助入口;下文 CTA 直达首页套餐与帮助(无需登录)。

11. 实战补充:与子代理、定时任务的关系

启用子代理或定时任务时,记忆写入应明确主会话与分支会话的边界,避免并行工具把同一 MEMORY 文件写冲突;重负载时宜把长检索与批处理迁到专用 worker,Gateway 只保留编排与窄工具面。参阅站内子代理与 Webhook 无人值守文章做组合选型。