OPENCLAW_2026
MEMORY_
TOKEN_
CONTEXT_CHECKLIST.

// 문제: OpenClaw는 답변을 생성하나, 스레드가 느려지거나 오래된 믿음이 사실처럼 떠오르거나, 업그레이드 뒤 기억 상실처럼 느껴지는 경우가 잦습니다. 그 원인은 대개 MEMORY.md와 워크스페이스 경계의 흐림, 잡음이 섞인 검색, 숨은 프리픽스에 쌓이는 토큰 부담이 동시에 겹치기 때문입니다. 결론: 메모리 층위 매트릭스, 다섯 단계 롤아웃, 인용 가능한 임계값, 토큰 팽창 진단 사다리, 그리고 원격 Mac 게이트웨이의 경로·환경 정합을 제시합니다. 구성: 문제 분해 | 층위 | 단계 | 임계값 | 사다리 | 질의응답 | 심화 | 관측 | 증거 | 마무리 | 현장 메모. 관련 글: 마이그레이션·재페어링, 무대응 게이트웨이 진단, 게이트웨이 상시 운영, MCP 토큰 예산, 온보딩·데몬, 원격 배포.

자동화 에이전트와 지식 워크플로 개념

1. 문제 분해: 메모리는 “마크다운을 더 쌓는 일”이 아니다

(1) 경계 이동: 로그·임시 메모·안정된 선호를 한데 섞어 MEMORY.md에 쌓으면 검색 시 오래된 가정이 사실처럼 주입됩니다. 워크스페이스의 제품 문서를 “페르소나 메모리” 층에 섞으면 해당 층 전체가 오염됩니다. 운영팀은 파일 하나를 지우는 대신, 어떤 층에 무엇이 들어가야 하는지 계약부터 다시 써야 합니다.

(2) 검색 잡음: 단순 키워드나 거친 청킹은 비슷한 표현이나 다른 결정을 한 덩어리로 취급합니다. 모델은 잘못된 구간을 “기억한 것”으로 확신합니다. 이런 실패는 모델 교체만으로는 거의 해결되지 않으며, 검색 게이트와 메타데이터 필터를 재정의해야 합니다.

(3) 토큰 팽창: 시스템 프롬프트, 채널 루브릭, 도구 JSON, MCP 스키마, 메모리 구간은 하나의 예산을 공유합니다. 지연 시간이 급증할 때 원인은 사용자에게 보이는 대화가 아니라 숨은 프리픽스에 있는 경우가 많습니다. 닥터나 채널 상태는 정상인데 지연만 커진다면, 모델을 바꾸기 전에 컨텍스트를 감사해야 합니다. 사다리 절차는 무대응 게이트웨이 진단 글과 함께 읽는 것이 좋습니다.

(4) 원격 경로 불일치: 원격 Mac 게이트웨이에서 ~/.openclaw와 워크스페이스는 노트북에서 머릿속으로 가정한 것과 다를 수 있습니다. 잘못된 사용자 계정으로 편집한 뒤 “기억이 사라졌다”고 느끼는 현상은 마이그레이션·재페어링 문서에서 다루는 유형과 같은 부류입니다. 게이트웨이 프로세스가 실제로 읽는 홈 디렉터리와 SSH로 접속한 셸의 홈을 혼동하지 말아야 합니다.

2. 층위화: 무엇을 어디에 둘 것인가

층위 담을 내용 안티패턴
장기 선호·용어집 안정된 사실, 조직 용어, 승인 경계 일회성 결론을 승격시키기, 버전·날짜 없이 보관
프로젝트 워크스페이스 문서 버전 관리되는 설계, API 계약, 런북 비밀, 쿠키, 웹훅 시크릿을 평문으로 보관
세션·단기 버퍼 스레드 목표, 미결 질문, 도구 중간 결과 요약·TTL 없이 무한 성장

표의 세 줄은 구현 세부가 아니라 검색 정책을 나누는 계약입니다. 층위가 섞이면 같은 질문이라도 채널마다 다른 “진실”이 주입되어 운영 사고로 이어집니다. 보안과 규정 준수 관점에서는 개인 정보와 조직 지식의 경계도 이 표 위에 덧씌워야 합니다.

3. 다섯 단계 롤아웃

  1. MEMORY 계약을 공표: 자동 기록과 사람의 승인이 필요한 항목을 구분하고, 장기 항목마다 범위(채널·프로젝트)와 최종 검증일을 붙입니다.
  2. 검색 게이트를 고정: 채널·디렉터리로 먼저 거르고, 그다음 벡터·키워드에 이릅니다. 전체 라이브러리를 기본으로 훑는 설정은 금지합니다.
  3. 롤링 요약을 버전 관리: 요약에는 생성 세대와 해시를 남기고, 업그레이드 뒤에는 중복 주입을 diff로 확인합니다.
  4. 도구 표면을 좁힘: 과제에 필요한 도구만 노출하고, 스키마·예시가 만드는 프리픽스 비용을 줄입니다(MCP 체크리스트).
  5. 원격 환경을 맞춤: launchd에 HOME, PATH, 비밀 경로를 명시하고, 재시작 후 메모리 읽기·쓰기 스모크 테스트를 수행합니다(온보딩 가이드).
# 제안 memory_record 필드 (스택에 맞게 조정) # { "scope": "channel:slack:xxx", "verified_at": "2026-04-11", # "source": "human|tool|import", "text": "...", "supersedes": "id-or-hash" }

4. 인용 가능한 임계값

내부 메모에 그대로 옮길 수 있는 수치(본인 로그로 재측정할 것):

  • 도구 반환과 메모리 구간이 합쳐져 루틴하게 약 8k 토큰(모델 윈도에 맞게 조정)을 넘고 p95 지연이 튀면, 메모리 행을 더 넣기 전에 도구를 줄이거나 검색을 단계화합니다.
  • 롤링 요약이 동일 결론을 턴군마다 세 번 이상 주입한다면 중복 제거가 없거나 요약 세대가 둘 이상 공존하는 경우가 많습니다.
  • “잘못된 기억·컨텍스트 폭발·업그레이드 후 기억 상실”에 주당 세 시간 이상 쓴다면, 영구적으로 파일만 손대는 대신 메모리와 게이트웨이 설정을 릴리스 게이트로 승격해야 합니다.

5. 토큰 팽창 진단 사다리

단계 점검 대상 흔한 근본 원인
1) 프리픽스 프로파일 시스템 프롬프트, 채널 규칙, 고정 면책 문구 여러 채널 블록을 복사해 중복 삽입
2) 도구·MCP 호출당 페이로드 크기, 중첩 JSON 페이지네이션·필드 투영 부재, 과도하게 넓은 스키마
3) 메모리 검색 Top-K와 구간당 상한 낮은 점수 청크까지 “안전하다”며 주입
4) 세션 요약 턴 수 대비 성장 절단·병합·만료 정책 없음

사다리는 위에서 아래로 순서대로 밟는 것이 좋습니다. 상단에서 이미 수천 토큰을 쓰고 있으면 하단의 메모리 튜닝만으로는 체감이 거의 없습니다. 각 단계에서 실측한 토큰 수를 로그 한 줄에 남기면, 이후 회귀 분석이 가능해집니다.

6. 질의응답: 자기 개선, 채널, 원격 Mac

질: 자기 개선 기록을 자동 적용할까요? 사람의 게이트를 두거나, 저위험 자동과 고위험 검토를 나누는 편이 안전합니다. 그렇지 않으면 오류가 곧바로 “조직의 기억”으로 굳습니다.

질: 모든 채널이 하나의 메모리 풀을 써도 됩니까? 규정과 잡음 기준으로 나누십시오. 지원 채널과 엔지니어링 채널이 메타데이터 필터 없이 동일 벡터 공간을 쓰면 교차 오염이 빈번합니다.

질: 원격 Mac의 경로는 무엇을 믿습니까? SSH로 접속한 계정이 아니라 게이트웨이 프로세스 사용자의 HOME을 기준으로 삼아야 합니다.

질: 업그레이드 뒤 기억이 비어 보입니다? 상태 디렉터리와 워크스페이스를 plist·컨테이너 이동 전후로 비교하십시오. 마이그레이션게이트웨이 롤백·상시 운영 문서를 함께 참고하면 복구 순서가 명확해집니다.

7. 심화: 채팅에서 운영으로

2026년 기준 기업용 에이전트는 감사 가능한 메모리와 예측 가능한 컨텍스트로 평가받습니다. 보안 조직은 어떤 행이 개인 정보인지 조직 지식인지, 삭제·보내기가 가능한지를 묻습니다. 계약에 범위와 보존 기간이 없으면 결국 파일 삭제로만 대응하게 되고, 그때마다 운영 부담이 반복됩니다.

엔지니어링 관점에서 메모리는 RAG와 경계가 흐립니다. 한쪽은 마크다운이고 다른 쪽은 벡터입니다. 흔한 실패는 이중 기록 불일치입니다. MEMORY는 갱신됐으나 인덱스는 다시 만들지 않아 검색이 오래된 구간을 끌어옵니다. 리뷰에서는 단일 진실 원천을 요구하거나, 재구축 런북을 의무화해야 합니다.

24시간 게이트웨이 호스트로 쓰는 원격 Mac에는 디스크와 백업이 따라옵니다. 스냅샷은 ~/.openclaw와 워크스페이스를 함께 다뤄야 하며, 복구 뒤에는 메모리 인덱스를 재구축할지 여부를 명시적으로 결정해야 합니다. 안정성 논리는 원격 배포 튜토리얼과 같은 축입니다.

게이트웨이에서는 최대 메모리 행 수, 행당 바이트, 성능 저하 시 동작(검색 시간 초과 시 세션 요약만 사용 등)을 상한해 두어 꼬리 지연을 설명 가능하게 만듭니다. 한계 없이 “가능한 만큼” 주입하면 지연 분포가 길어질 뿐 아니라 장애 시 원인 추적도 어려워집니다.

8. 관측 가능성

요청마다 로그에 남길 것: 주입된 메모리 개수와 토큰, 빈 적중률, 도구별 페이로드 p95, 요약 재작성 횟수. 네 지표가 함께 흔들리면 설정 표류를 의심하고, 지연만 불안정하고 메모리 수는 안정이면 도구·MCP 쪽을 먼저 봅니다.

신호 방법 의심 지점
메모리 주입 토큰 요청 단위 구조화 로그 Top-K 과다, 구간 과장, 중복 제거 부재
검색 적중률 시간당 고정 질문 세트 오래된 인덱스, 잘못된 범위 필터
도구 페이로드 크기 도구별 백분위수 페이지네이션 부재, 응답에 추적 로그 포함

대시보드가 없더라도, 위 표의 세 줄만 주간으로 스프레드시트에 옮겨도 추세는 잡힙니다. 중요한 것은 “느리다”는 정성적 보고를 “어느 층에서 몇 토큰인가”로 바꾸는 일입니다.

9. 증거 패키지

스크린샷만으로는 부족합니다. MEMORY 계약 버전, 검색 매개변수 표, 업그레이드 전후 프리픽스 diff, 기대 메모리가 있었던 실패 스레드를 묶습니다. 실패 사례 없이 통과한 리뷰는 실제 트래픽 한 주를 견디기 어렵습니다. 감사 대응 시에도 동일한 묶음이 요구됩니다.

내부 감사에서는 “무엇이 자동으로 기록되는가”와 “누가 승인하는가”를 분리해 질문합니다. 계약 문서와 실제 설정 파일의 해시를 함께 보관하면, 나중에 “그때는 그랬다”는 논쟁을 줄일 수 있습니다.

10. 마무리: 개발용 노트북은 관대하나, 운영은 예측 가능성을 요구한다

(1) 한계: 기본 메모리 정책은 쉽게 잡음이 생기고, 도구·MCP는 프리픽스를 부풀리며, 다중 채널과 원격 경로는 표류하기 쉽습니다.

(2) 원격 Mac의 이점: 고정 사용자와 plist, 통일된 절전·백업 자세, 본 시리즈의 다른 OpenClaw 가이드와 같은 macOS 동작을 공유합니다.

(3) MACGPU: Apple Silicon 원격 노드를 임대해 게이트웨이 호스팅 부담을 줄이고, 이상한 VPS 스택을 맞출 필요를 덜 수 있습니다. 하단 배너에서 도움말과 요금 정보로 이어집니다.

운영 조직에 납품할 때는 본문의 매트릭스와 사다리를 체크리스트 한 장으로 압축해, 릴리스 전 서명란을 두는 방식도 효과적입니다. 새 입사자 온보딩 때 같은 문서를 읽히면 “왜 이 파일은 MEMORY에 넣지 말라고 했는가”에 대한 공통 언어가 생깁니다.

11. 현장 메모: 하위 에이전트와 스케줄

하위 에이전트나 스케줄이 있을 때는 부모 세션과 분기 세션의 쓰기 소유권을 정의해 동시에 MEMORY를 손상시키는 경쟁을 막습니다. 무거운 검색은 워커로 넘기고, 게이트웨이 오케스트레이션은 좁은 도구 표면을 유지합니다. 웹훅·무인 실행 설계는 별도 글과 짝을 이루며, 본문에서 강조한 경로·환경 정합을 먼저 맞춘 뒤 트리거를 늘리는 순서가 안전합니다.

마지막으로, 메모리 정책은 한 번 고정하면 끝이 아니라 모델·도구·채널이 바뀔 때마다 재검증해야 합니다. 분기마다 프리픽스 토큰과 주입 행 수를 다시 재면, “갑자기 느려졌다”는 신고를 수치로 환원할 수 있습니다. 이는 팀 전체의 의사결정 비용을 줄이는 가장 값싼 투자입니다.