2026 OpenClaw 记忆与上下文怎么治：`MEMORY.md`、检索策略与 Token 膨胀——可复现排错清单（含远程 Mac Gateway 路径）

// 痛点：OpenClaw 已能回复，但对话越长越慢、引用老结论、或升级后「像失忆」——根因往往在MEMORY.md 与 workspace 边界不清、检索策略把噪声当记忆、系统提示与工具返回把上下文撑爆三类问题叠在一起。结论：本文给出记忆分层对照矩阵、五步落地、三条可引用阈值、Token 膨胀诊断阶梯，以及远程 Mac Gateway下状态目录与 launchd 环境对齐清单。结构：痛点｜矩阵｜步骤｜阈值｜排错｜FAQ｜深度观察｜可观测性｜评审证据｜收束。延伸阅读：《迁移与 Gateway 重配对》《无回复与 doctor 排错》《Gateway 常驻与回滚》《MCP 与 Token 预算》《onboard 与常驻》《远程 Mac 部署》《套餐与节点》。

1. 痛点拆解：记忆不是「多写几段 Markdown」

（1）边界漂移：把运行日志、临时草稿与长期偏好全塞进 MEMORY.md，检索时会把过期假设当真理；而 workspace 里的业务文档若被误当「系统记忆」，又会污染人格层。（2）检索噪声：纯关键词或粗粒度分块会把相似措辞、不同决策混在一起，模型看起来「记得很多」实则召回的是错片段。（3）Token 膨胀：系统提示、频道历史摘要、工具 JSON、MCP schema 与记忆片段同池竞争；你只盯着对话字数时，真正的爆点往往在隐藏前缀。升级后若 doctor 与 channels 正常仍变慢，优先做上下文审计而非换模型（参见《无回复排错》的诊断阶梯）。（4）远程路径与权限：Gateway 跑在远程 Mac 时，~/.openclaw 与 workspace 若与用户预期不一致，会出现「本机改完、线上没生效」的假失忆——与《迁移 Runbook》同类。

2. 记忆分层：写什么、不写什么

层级	建议承载	反模式
长期偏好 / 术语表	稳定事实、组织内专有名词、审批边界	把一次性任务结论当永久真理；不写版本与日期
项目 workspace 文档	可版本化的设计说明、接口契约、Runbook	把密钥、Cookie、Webhook secret 明文落盘
会话级 / 短期缓冲	当前线程目标、待确认问题、工具中间态	无限累积不裁剪，导致同一摘要重复注入

3. 落地五步走：把记忆变成可审计工程

写清 MEMORY 契约：规定哪些键/段落可自动写、哪些必须人工审；每条长期记忆带生效范围（频道/项目）与最后验证日期。
固定检索入口：先过滤频道与目录，再向量/关键词；禁止「全库一把梭」作为默认路径。
摘要策略版本化：长会话滚动摘要要有代数与哈希，升级后对比是否重复注入旧摘要。
工具面收窄：MCP/Skills 只暴露当前任务需要的工具，降低 schema 与示例对前缀的占用（详见《MCP 与 Token》）。
远程环境对齐：launchd plist 中显式写入 HOME、PATH 与密钥引用路径；重启后跑一遍「记忆读写自检」脚本，确认与交互 shell 一致（参阅《onboard 与常驻》）。

# 心智模型：memory_record 建议字段（按你的栈调整）
# { "scope": "channel:slack:xxx", "verified_at": "2026-04-11",
#   "source": "human|tool|import", "text": "...", "supersedes": "id或哈希" }
                

4. 可引用阈值（评审向）

可写进方案书的量级（需用你的日志复测）：

当单次请求里工具返回 + 记忆片段合计稳定超过约 8k tokens（依模型窗口调整）而 p95 延迟陡升时，应优先裁剪工具面或分段检索，而不是先加记忆条数。
若滚动摘要每轮重复注入导致同一结论在上下文中出现 3 次以上，通常存在摘要去重缺失或两代摘要并存。
团队每周在「记忆错乱 / 上下文爆炸 / 升级后失忆」上浪费超过3 小时，应把记忆治理与网关配置升格为发布门禁，而不是继续手工改 MEMORY。

5. Token 膨胀：诊断阶梯

阶梯	检查什么	常见根因
1）前缀剖面	系统提示、频道规则、固定免责声明各占比例	多频道策略复制粘贴导致重复块
2）工具与 MCP	单次调用返回体积、是否嵌套大 JSON	未分页、未字段投影、schema 过宽
3）记忆检索	Top-K 与片段最大长度	「多即是好」把低分片段也注入
4）会话摘要	摘要是否随轮次线性增长	无截断、无合并、无过期策略

6. FAQ：自改进、多频道与远程 Mac

问：自改进写入 MEMORY 要不要自动生效？建议默认人工闸门或「低影响自动 / 高影响待审」两档；否则错误会被固化成「组织记忆」。

问：多频道共用一份记忆吗？按合规与噪声拆分：客户支持与内部研发不宜共用同一向量空间；至少做 scope 元数据过滤。

问：远程 Mac 上路径怎么验？以Gateway 进程实际用户的 HOME 为准，而不是你 SSH 登录用户；不一致时表现为「文件在、读不到」。

问：升级后失忆？先比对状态目录与 workspace是否随 plist/容器变更；完整清单见《迁移》与《Gateway 回滚》。

7. 深度分析：从「能聊天」到「能运营」

2026 年代理栈的竞争点已从「能不能连上模型」转向记忆是否可审计、上下文是否可预测。企业内部署时，法务与安全会追问：哪些记忆是个人偏好、哪些是组织知识、是否可删除与可导出——若在设计阶段不把 scope 与保留期限写进契约，上线后只能打补丁式删文件。

工程上，记忆与 RAG 的边界越来越模糊：一边是 Markdown/笔记，一边是向量库。OpenClaw 用户常犯的错误是双写不同步——MEMORY 里改了结论，向量库未重建，检索仍拉回旧段落。评审应要求给出单一真源或明确的同步 Runbook。

远程 Mac 作为 7×24 Gateway 宿主机时，记忆治理还要叠加磁盘与备份：时间机器或快照策略是否包含 ~/.openclaw 与 workspace；恢复后是否要触发「记忆重建/重索引」——与《远程部署》中的稳定性章节同一逻辑。

与下游模型衔接时，要在网关层约定最大记忆条数、单条上限、失败降级（检索超时则只用会话摘要），使尾延迟可解释；否则运维会把一切慢都归因为「模型不行」。

8. 可观测性：把「偶发胡说」写成指标

建议在 runbook 固定：每轮注入的记忆条数与总 tokens、检索空结果率、工具返回 p95 体积、摘要重写次数。四类同时恶化时优先怀疑配置漂移；仅延迟恶化而记忆条数稳定，优先怀疑工具/MCP 返回。

观测项	采集方式	异常时优先怀疑
记忆注入 tokens	每请求结构化日志	Top-K 过大、片段过长、去重缺失
检索命中率	固定问题集小时回归	索引未更新、scope 过滤错误
工具返回体积	按工具名分位数	未分页、trace 级别日志进响应

9. 对内评审：你该索要的证据包

除截图外，应包含：MEMORY 契约版本、检索参数表、升级前后上下文剖面对比、失败对话样本与期望记忆。没有失败样本的评审，往往在真实流量第一周被推翻。

10. 收束：本机联调轻快，生产要记住「可预测」

（1）当前方案限制：默认记忆策略易噪声化；工具与 MCP 易撑爆前缀；多频道与远程路径易漂移。

（2）为什么远程 Mac 常更省心：专用节点固定用户与 plist，睡眠策略与备份可统一；与本站其它 OpenClaw 教程同一 macOS 行为面。

（3）与 MACGPU 场景：若你希望低门槛试用常驻远程 Mac 跑 Gateway 并复用 Apple Silicon 工具链，而不是维护杂牌 VPS 环境，MACGPU 提供可租赁节点与帮助入口；下文 CTA 直达首页套餐与帮助（无需登录）。

11. 实战补充：与子代理、定时任务的关系

启用子代理或定时任务时，记忆写入应明确主会话与分支会话的边界，避免并行工具把同一 MEMORY 文件写冲突；重负载时宜把长检索与批处理迁到专用 worker，Gateway 只保留编排与窄工具面。参阅站内子代理与 Webhook 无人值守文章做组合选型。

OPENCLAW_2026 MEMORY_TOKEN_CONTEXT_RUNBOOK.