2026 Dev MLX : uv/Conda, garde ARM64, lockfile, split distant

// Douleur : la CI passe mais les portables divergent ; un terminal Rosetta rend les benchmarks Metal incomparables. Conclusion : matrice uv/Conda, garde arm64, lockfile comme source de vérité, trois seuils pour basculer les builds lourds vers un Mac Apple Silicon distant. Voir Ollama/LM Studio/MLX, dev IA & CI, SSH vs VNC, offres.

1. Analyse des blocages : « import mlx » ne valide pas une release

(1) Fuite d’architecture : Homebrew, Python et Node doivent suivre une seule ligne arm64. Un terminal Rosetta suffit à fausser les benchmarks Metal et à faire croire à une régression alors que seul le binaire est incohérent. (2) Dérive transitive : figer les paquets racine sans graphe complet laisse numpy/mlx-lm se réorganiser silencieusement et relancer des compilations Metal inattendues. (3) Mémoire unifiée : onglets, NLE, IDE et installation éditable partagent le même budget ; avec du swap, les builds deviennent limités par le disque plutôt que par le GPU.

2. Matrice uv vs Conda (MLX, 2026)

Axe	uv + uv.lock	Conda / Mamba
Granularité du verrou	Graphe complet, très adapté aux services Python et aux images CI	Binaires conda-forge solides ; il faut figer la plateforme dans l’export
Apple Silicon	Rapide dès que l’interpréteur est arm64 natif	Couverture arm64 large ; ritualiser `conda-lock` en équipe
Reproductibilité	`uv lock` puis `uv sync`	Artefacts conda-lock versionnés ; tout changement de canal passe en revue
Adoption équipe	Proche mentalité pip/venv	Coût de formation faible si Jupyter+conda est déjà la norme

3. Cinq étapes : shell propre jusqu’au lock commité

Geler l’architecture : uname -m et python -c "import platform; print(platform.machine())" doivent afficher arm64 ; désactiver Terminal en Rosetta.
Xcode CLT : xcode-select --install pour clang — son absence ressemble souvent à un timeout réseau côté pip.
Environnement isolé : ex. uv venv .venv && source .venv/bin/activate ou env conda selon la politique ; pas de Python système pour le projet.
Lock = source de vérité : committer uv.lock ou conda-lock dans la PR ; fini les versions « à l’oral » sur Slack.
Test d’acceptation minimal : snippet mlx/mlx-le plus petit possible, avec commande, versions et durée réelle notées dans le README.

uname -m
python -c "import platform; print(platform.machine())"
file "$(which python)"
                

4. Chiffres pour dossiers et revues

Portable 16 Go unifiés : builds sources parallèles montent facilement à 12–14 Go résidents — fermer les onglets ou déporter la compilation.
>3 h/semaine perdues sur l’environnement → investir d’abord dans lockfile, cache CI et garde arm64 plutôt que du CPU.
Écart de minor Python >1 entre poste et CI → risque ABI ; voir aussi mémoire unifiée & swap.

5. Quand basculer vers un nœud Mac distant

Signal	Action
Chaîne de build >25 min, >2×/semaine	Sandbox distante haute RAM ; le Mac local sert à l’édition et à la revue
Partage de machine avec la créa, pression mémoire jaune chronique	Isoler batch et prétraitement ; guide connexion SSH vs VNC
CI verte, poste rouge	Comparer hash de lock, version CLT et architecture avant de blâmer MLX
Livrables couleur / chaîne Metal	Privilégier un Apple Silicon distant plutôt qu’un GPU Linux seul ; cadre dev IA & CI

6. FAQ : Rosetta, TLS, double gestionnaire

CI rapide, laptop lent ? L’inspection TLS pousse souvent vers des builds sources faute de wheels — vérifier avec pip -v ou mode verbose d’uv. Python système ? Les mises à jour macOS cassent les venv silencieusement. mlx + numpy 2.x ? Suivre le lock ; rejouer le test minimal après chaque bump mineur.

pip dans conda ? C’est de la dette ; si inévitable, réécrire la définition d’environnement et régénérer conda-lock. Désactiver SIP ? Rarement nécessaire pour MLX ; méfiance envers les tutos obsolètes.

7. Analyse : la traçabilité des dépendances comme actif

En 2026 le débit MLX devient une commodité ; la différenciation vient de graphes figés et auditables. Pendant qu’Ollama démocratise l’inférence locale, les équipes ingénierie subissent des tickets « chez moi ça marche » — cause typique : dérive transitive et mélange d’architectures, pas MLX lui-même.

Les studios mélangent étalonnage vidéo et builds Python sur une mémoire unifiée partagée ; la pente de charge est plus raide que dans un pur atelier dev. Un Mac distant dédié achète du temps de build prévisible et un bureau interactif plus calme, sans quitter Metal.

Côté conformité, finance et santé demandent déjà des preuves de reconstruction d’environnement. Lockfile, captures arm64 et journaux d’acceptation battent les versions annoncées à l’oral. Après le choix de stack via Ollama / LM Studio / MLX, ce guide industrialise l’étape suivante.

8. Synthèse : limites locales, intérêt du Mac distant, MACGPU

(1) Limites du tout-local : queues de swap, benchmarks faussés par Rosetta, dépendances fantômes conda+pip.

(2) Pourquoi un Apple Silicon distant aide : séparer compilations batch et machine interactive tout en gardant la même chaîne créative et Metal.

(3) Lien MACGPU : louer un Mac distant à forte mémoire unifiée pour valider locks et gros builds avant un gros CAPEX matériel — le CTA ci-dessous mène aux offres publiques et à l’aide sans connexion.

2026_APPLE_SILICON MLX_DEV_UV_CONDA_LOCKFILE.