1. Du chat à l’API : frictions
(1) Écoute : 127.0.0.1 isole le LAN ; 0.0.0.0 sans auth élève la surface d’attaque.(2) TLS : au-delà du loopback, terminez au proxy.(3) Durée de vie : le terminal meurt avec la veille ; launchd assure la persistance.(4) Mémoire : le parallélisme gonfle le cache KV et les queues de latence.
2. Tableau des modes
| Mode | Usage | Contrôles minimum |
|---|---|---|
| Boucle locale | Scripts personnels | Ports, collisions |
| LAN privé | Bureaux | Proxy, filtrage IP, débit |
| Internet | Équipes distribuées | TLS, clés API/OIDC, journaux |
| Mac distant dédié | 24/7, charge stable | Supervision, rôles séparés |
3. MLX et fidélité du contrat
Streaming, taille des schémas d’outils et fenêtre de contexte déclarée doivent refléter la réalité du KV. Mesurez P95 en 1/5/10 clients. Si la SLO casse à faible charge, la topologie prime sur le prompt engineering.
4. launchd en cinq étapes
Chemins absolus, répertoire de travail, journaux, KeepAlive prudent, tests santé depuis deux hôtes.
5. FAQ
Liez le worker à 127.0.0.1 ; TLS et auth au bord. Multi-utilisateurs : clés obligatoires. Changer l’amont vers un Mac distant préserve les clients.
6. Quand basculer vers un nœud distant
| Signal | Action |
|---|---|
| >3 flux + IDE/navigateur | Décharger l’inférence lourde |
| SLA et montée stable | Nœud dédié |
| URL partagée d’équipe | Quotas hors portable perso |
| Batchs nocturnes seuls | launchd peut suffire |
Chiffres de référence :
- 8 Go+ réservés à macOS et apps avant le modèle.
- TLS au proxy ; worker en loopback.
- Pression mémoire rouge >30 min/jour pendant une semaine : problème d’architecture.
7. Analyse : la couche API comme standard
La mémoire unifiée excelle en usage solo ; l’HTTP importe files d’attente et latences de queue. Pour le créatif, les rafales de complétion rivalisent avec la timeline. Séparer l’édition locale du contrat exposé préserve l’expérience Metal tout en professionnalisant l’offre d’inférence.
Si la concurrence et la disponibilité se heurtent, louer un Mac distant MACGPU conserve macOS/Metal tout en isolant la charge ; la facturation à l’usage facilite l’expérimentation.