1. Повторяющиеся сбои
Размытые предпосылки, неверная модель процесса, слабая наблюдаемость — три класса, не зависящие от частоты релизов.
2. Предпосылки
| Пункт | Совет | Риск |
|---|---|---|
| Node | Версия по документации | Несовместимость нативных модулей |
| Пакетный менеджер | Один на репозиторий | Дрейф lockfile |
| Пути | Проверить реально читаемые файлы | Редактирование «в никуда» |
| Ключи API | Минимальные права | Стоимость/утечки |
3. Зачем onboard
Связать ключи, канал, режим запуска и рабочую область. При ошибке сохранить стек и номер шага.
4. Foreground и daemon
Сначала видеть stdout, затем тот же health-check под daemon; явно задать WorkingDirectory и переменные среды.
5. Пять шагов дымового теста
Слушатель/health → минимальное сообщение → метки в логах → прокси/TLS → версия и ID успешного запроса.
6. Порты и логи
| Симптом | Сначала | Действие |
|---|---|---|
| Порт занят | lsof | Убить зомби или сменить порт |
| Daemon падает сразу | Журналы службы | Воспроизвести в foreground |
| Канал молчит | Webhook/файрвол | curl внутри/снаружи |
| Рваные обрывы | Сон/лимиты API | Питание, backoff |
Опора:
- Читать логи непрерывными блоками строк.
- До/после минорного апдейта — health + один E2E.
- На удалённом Mac следить за свободным местом и ротацией логов.
7. Долгий хостинг на удалённом Mac
Политика сна, автоподъём после обновления ОС, ротация, пользователь службы — краткий ежемесячный runbook.
8. Воспроизводимые пути запуска
Артефакты onboard и health-команды лучше версионировать, чем раздувать список фич. Вынести шлюз на выделенный удалённый Mac разгружает GPU/медиа-задачи на рабочей станции.
Узлы MACGPU дают стабильное питание и дисковый запас; почасовая оплата удобна для пилота.