1. Разбор боли: дообучение — контракт, не рычаг
(1) Дрейф цели. Многие задачи — поиск и формат; обучение раздувает разметку и оценку. (2) Иллюзия ресурсов. Вывод терпит квантование; обучение часами держит шину памяти вместе с IDE, браузером и таймлайном. (3) Воспроизводимость. Сиды и батчи меняют кривые; без фиксированного образа «у меня на Mac» не становится командным активом.
2. Матрица решений
| Сигнал | Скорее путь |
|---|---|
| Ответы зависят от часто меняющихся доков | RAG с цитатами |
| Фиксированный тон бренда, таблицы, отказы | малый SFT, сначала mlx-tune smoke |
| Сотни узких примеров | локальный прогон, следить за переобучением |
| Десятки тысяч примеров, много sweep | локально только plumbing, sweep удалённо |
3. Пять шагов
1. Заморозить eval. 2. Минимальная модель для пайплайна. 3. Отпечаток среды (версия MLX, хеш данных, CLI). 4. Термика и swap. 5. Базовые линии: до/после vs только RAG.
4. Опорные числа (не SLA)
- Не меньше 12 ГБ запаса под macOS и приложения до состояния оптимизатора.
- Более шести часов полной нагрузки при дневной работе — ночной или удалённый хост.
- Более трёх полных sweep в неделю — 24/7 удалённый Mac часто сокращает календарь.
5. Когда переносить на удалённый Mac GPU
| Сценарий | Рекомендация |
|---|---|
| Solo PoC, <2k примеров | локально ок, следить за питанием |
| Общая среда, аудит-логи | выделенный удалённый узел |
| Параллельные sweep к дедлайну | масштабировать удалённо |
| Вывод, экспорт, обучение конфликтуют | немедленно разделить роли |
6. FAQ
Валидация лучше, прод хуже? Сдвиг распределения, сверка с реальными логами, откат чекпоинта. Данные на ноутбуке? Шифрование и бэкапы; тенант с SSH иногда проще аудировать.
7. Углубление: дообучение стало инженерией процессов
В 2026 mlx-tune снижает порог, но битва за трекинг экспериментов и учёт стоимости. Недокументированные локальные прогоны «бесплатны», пока весь отдел не встанет на отладку. Зрелые команды делают локальную валидацию → удалённые sweep → лучший чекпоинт на интеграцию — зеркало схемы «локальный UX + удалённый API». Для медиа-пайплайнов offload снимает конкуренцию за SSD при длинном экспорте.
Дымовой тест на основном Mac логичен; та же Apple Silicon доступна на арендованных удалённых Mac с чётким разделением ролей. Почасовые узлы MACGPU соответствуют модели «разнести вывод и обучение» без преждевременного CAPEX.