01_Зачем продакшен-развёртывание OpenClaw
Разработчики хотят стабильно крутить OpenClaw месяцами: мультиагенты, cron, круглосуточная готовность. Но на ноутбуке — троттлинг при нагрузке, сон при закрытой крышке, 16–32 ГБ ОЗУ съедаются LLM и инструментами. На VPS x86 — виртуализация, отсутствие Metal, неоптимальный инференс. OpenClaw v2026.2.26 ввёл openclaw secrets и улучшенную cron-надёжность, но чтобы мультиагенты реально работали 24/7, нужна среда: bare metal Apple Silicon, единая память, Metal API, выделение ресурсов.
Продакшен здесь означает: 7×24 доступность, секреты вне репозитория, задачи не теряются, агенты изолированы по памяти. MACGPU даёт bare metal M4 Pro/Max — без виртуализации, с полным Metal throughput и типовой ПСП 273 ГБ/с для M4 Pro. Идеальная площадка для OpenClaw в режиме продакшена.
Metal API, без гипервизора, полная частота
CPU/GPU/ANE в одном адресном пространстве
Нет сна, нет троттлинга, удалённый доступ
02_openclaw secrets: управление учётными данными
В OpenClaw v2026.2.26 openclaw secrets — это штатный путь хранения API-ключей, токенов OAuth, строк подключения к БД. Раньше всё лежало в .env или переменных окружения: риск утечки, сложная ротация, невозможность развести права между агентами. secrets даёт source: env, file, exec — ссылки на внешние провайдеры, без plaintext в конфиге.
Основные команды: openclaw secrets audit — аудит конфигурации; openclaw secrets configure — настройка провайдеров; openclaw secrets apply — применение; openclaw secrets reload — перезагрузка снапшота без рестарта.
На bare metal M4 при systemd/launchd храните секреты вне проекта, chmod 600, загрузка через EnvironmentFile с ограничением доступа root. Таким образом ключи остаются в одном месте, а агенты получают их через runtime snapshot.
03_cron и launchd: надёжность расписания
Продакшен OpenClaw часто использует расписание: отчёты, синхронизация, прогрев моделей. Системный cron уязвим: рестарт ноды, сбой демона, перекрытие задач — пропуски или дубликаты. В v2026.2.26 есть task lock, таймауты и retry. Рекомендации:
- Использовать flock или встроенный lock — запретить параллельный запуск одной задачи
- Выставить таймаут для длинных задач, логировать и алертить при превышении
- Держать cron/launchd в версионировании вместе с конфигурацией агентов
- На macOS предпочесть launchd вместо cron — восстанавливается после рестарта
Пример launchd plist:
launchd перезапускает расписание после загрузки системы — без ручного cron reload. Для критичных задач добавьте TimeoutStartSec и WatchPaths при необходимости реагировать на файловые события. Комбинация launchd + webhook /hooks/wake даёт гибкость: расписание для регулярных задач, внешний триггер для on-demand.
04_Выделение ресурсов: память и CPU под мультиагентов
При параллельной работе нескольких агентов важно ограничить потребление памяти, чтобы один тяжёлый агент не вытеснял остальные. M4 Pro 36GB/64GB — unified memory, CPU и GPU в одном адресном пространстве. Рекомендации: задать лимит через переменную окружения (например OPENCLAW_AGENT_MEMORY_LIMIT=4G), мониторить фактическое потребление.
| Тип агента | Рекоменд. ОЗУ | Назначение |
|---|---|---|
| Лёгкий (мессенджеры, вызовы tools) | 2–4 ГБ | Telegram/Slack, простые инструменты |
| Инференс (LLM, long context) | 4–8 ГБ | Многоходовой диалог, генерация кода |
| Тяжёлый (локальная модель) | 8–16 ГБ+ | Ollama, RAG, локальный инференс |
На M4 unified memory нет отдельной видеопамяти — всё в едином пуле. Для 2–3 инференс-агентов плюс Ollama 8B хватает 64 ГБ; на 36 ГБ лучше держать 2 инференс-агента или 1 тяжёлый. Metal throughput и ANE дают выигрыш в latency по сравнению с x86 VPS. Рекомендуется логировать RSS каждого агента (через ps или встроенный мониторинг OpenClaw) и настраивать алерты при превышении 80% доступной памяти — это предотвращает OOM и падение всего инстанса.
05_Metal и ANE: почему M4 подходит для OpenClaw
M4 Pro: 14 CPU cores, 16-core GPU, 16-core Neural Engine. Пропускная способность памяти 273 ГБ/с — для LLM инференса это критично: модель загружается в unified memory, Metal выполняет матричные операции на GPU, ANE ускоряет inference там, где поддержано. Виртуализация (VM, контейнеры без нативного Metal passthrough) режет throughput и добавляет latency. Bare metal M4 на MACGPU — полный доступ к Metal API, без гипервизора.
Практический эффект: инференс 7B–10B на M4 Pro даёт 20–40 tok/s в зависимости от контекста; на типовом x86 VPS с T4 — в разы медленнее при сопоставимой цене. Для мультиагентов, где несколько агентов вызывают LLM параллельно, unified memory и высокая ПСП снижают contention.
Архитектура памяти и инструкции
Apple Silicon использует ARM Neoverse-подобные ядра с расширениями AMX (Apple Matrix Coprocessor). При инференсе LLM основная нагрузка — матричное умножение; AMX и Metal MPSGraph оптимизированы под эти паттерны. Конкуренция за bandwidth между CPU и GPU минимальна благодаря unified memory: копирование тензоров между адресными пространствами не требуется, что снижает latency на 30–50% по сравнению с дискретной видеопамятью. В OpenClaw слой инференса (llms.openai, ollama и др.) автоматически использует MPS при доступности — на bare metal M4 это всегда активно.
06_MACGPU M4: преимущества для продакшена
MACGPU предлагает bare metal узлы M4 Pro/Max: 24/7 без сна и троттлинга, удалённый SSH, возможность запуска по webhook или cron. Сравнение с альтернативами: локальный Mac — CapEx, сон, ограниченная масштабируемость; x86 VPS — нет Metal, слабый инференс; облачные GPU — высокая цена. M4 аренда — OpEx, стабильная производительность, нативный macOS и Metal, низкая latency для OpenClaw.
Итого: openclaw secrets для учётных данных, launchd вместо cron для расписания, жёсткие лимиты памяти для мультиагентов. MACGPU M4 bare metal — платформа для круглосуточного OpenClaw без CapEx и с предсказуемым throughput.