2026 OPENROUTER
TOKEN_
VS_
REVENUE_
MAC.
Sur openrouter.ai/rankings, Top Models, Market Share et Trending racontent des histoires différentes — la facture ne suit pas toujours « ce qui buzz ». La série de mai a couvert le classement global, la programmation, les Tool Calls, la multimodalité entrée et la génération d'images / Languages. Début juin 2026, il faut formaliser la lecture à double voie : choisir les modèles par défaut selon le volume hebdomadaire de tokens, piloter le budget selon le revenu en dollars et le prix unitaire — deux logiques distinctes. Instantané du 30 mai (agrégats publics) : ~31,34T tokens/semaine, revenu hebdo estimé ~32,4 M$ ; Anthropic ~42 % du revenu pour ~11 % des tokens ; Xiaomi MiMo-V2.5-Pro ~2,30T (+432 % WoW), revenu ~438 K$ seulement. Ce guide professionnel couvre : instantané — tableau croisé — couche Provider — alertes WoW — six étapes — matrice décisionnelle — cas client — chiffres citables et checklist.
1. Diagnostic : suivre le mauvais classement coûte cher
Erreur n°1 — Top Models = « le meilleur » : MiMo-V2.5, DeepSeek V4 et Qwen dominent le volume grâce à un throughput bon marché, pas parce qu'ils excellent en raisonnement complexe. Erreur n°2 — ignorer le revenu : Claude Opus 4.7 peut consommer peu de tokens tout en absorbant le budget à 5 $ / 25 $ par million. Erreur n°3 — confondre auteur et Provider : SiliconFlow traite ~4,04T tokens (juste derrière Google ~4,28T), alors que Market Share affiche DeepSeek/Qwen comme modèles de base — en production, c'est le Provider qu'on change. Erreur n°4 — spike WoW sans plafond : Xiaomi +432 %, Alibaba +75 % en une semaine ; un default figé dans Cursor/OpenClaw bascule vers des chemins non testés. Erreur n°5 — pas de séparation local/API : DeepSeek/Qwen quantifiables en MLX continuent sur OpenRouter — mémoire unifiée sous-utilisée, facture API en hausse.
2. Trois phrases pour lire OpenRouter début juin
| Dimension | Instantané 30.05. (agrégats publics) | Lecture Mac |
|---|---|---|
| Débit global | ~31,34T tokens/sem. ; ~32,4 M$/sem. (estim.) | Agents à l'échelle → budgets par bucket |
| Provider #1 volume | Google ~4,28T ; SiliconFlow ~4,04T | Mesurer la stabilité Provider, pas seulement le nom |
| Spike WoW | Xiaomi +432 % ; Stealth/Owl ~1,58T émergent | Diff hebdo default + fallback |
| Revenu #1 | Anthropic ~42 % (~13,6 M$/sem.) | Tâches difficiles, pas le default quotidien |
| Tokens éditeurs CN | >60 % combinés (sources convergentes) | Coût favorable ; conformité à part |
3. Double voie : rois du volume vs. rois du revenu
| Voie | Représentants | Tokens/sem. (approx.) | Revenu/sem. (approx.) | Usage Mac typique |
|---|---|---|---|---|
| Volume | MiMo-V2.5-Pro, DeepSeek V4 Pro, Qwen 3.6+ | Xiaomi 2,30T ; DeepSeek 1,32T | Xiaomi ~438 K$ ; DeepSeek ~219 K$ | Complétion Cursor, agent OpenClaw 7×24 |
| Revenu | Claude Opus 4.7, GPT-5.5 | Anthropic 3,51T (famille) | Anthropic ~13,6 M$ (42 %) | Revue architecture, bugs critiques, conformité |
| Décalage | Routage Google + tarif Claude | Google volume max | Bedrock/Azure + prix Anthropic | Vérifier le Provider réel dans l'IDE |
Conclusion : Top Models / Market Share pour le default économique ; structure de revenu pour les quotas modèles premium. Les deux coexistent — la plateforme sépare « commodity token » et « premium dollar » ; les équipes Mac maintiennent deux tables de routage.
4. Couche Provider : SiliconFlow, Novita ≠ classement auteur
Market Share segmente par auteur de modèle (Xiaomi, Qwen, Anthropic) ; les requêtes passent par des Providers (SiliconFlow, Novita, DeepInfra, direct). Instantané 30.05. : SiliconFlow ~4,04T tokens, revenu ~609 K$ → trafic massif à marginal très bas ; Novita ~1,77T, WoW −19 % → les Providers se réorganisent chaque semaine. Lors de la config OpenRouter, journaliser le Provider effectivement atteint (panneau Usage) — même identifiant modèle, latences P95 et rate limits différents.
5. Alerte WoW : structurer le fallback
En une semaine : Xiaomi +1,87T (+432 %), Alibaba +612B (+75 %) ; StepFun, Novita, Moonshot reculent. Pour OpenClaw / Cursor, adopter un fallback à trois niveaux : ① default MiMo-V2.5 ou DeepSeek V4 Flash (classement volume + $/M bas) ; ② qualité Qwen3.7 / GLM-5 ; ③ secours Claude Opus 4.7 (plafond journalier). Semaine de spike : interdire l'upgrade automatique sans limite — 50 prompts de régression sur Mac distant ou local avant production.
6. Six étapes : double classement → table de routage Mac
Étape 1 — Rankings + Usage chaque semaine
Top 5 Top Models vs. Top 3 de votre facture ; écart = mauvaise voie active.
Étape 2 — Séparer voie Token et voie Dollar
Voie Token : default + agent ; voie Dollar : Opus/GPT avec cap journalier (ex. 20 $/jour).
Étape 3 — Annoter le Provider
Pour DeepSeek V4 Pro : comparer P95 SiliconFlow vs. officiel.
Étape 4 — Référence MLX locale
Qwen/DeepSeek quantifiables le jour via /v1 local ; agent nocturne via OpenRouter.
Étape 5 — Aligner openclaw.json
Modèle principal et tableaux fallback par voie ; voir runbook fallback drift.
Étape 6 — Sur 429 : descendre avant de monter
Backup voie Token, puis voie Dollar — pas Opus pour tout immédiatement.
7. Matrice trois voies : MLX local / API OpenRouter / Mac distant
| Scénario | Chemin | Quel classement | Validation |
|---|---|---|---|
| Complétion IDE quotidienne | Ollama/MLX local ou ligne bon marché OpenRouter | Voie Token Top 5 | P95 <800 ms ; <0,3 $/M effectif |
| Agent OpenClaw 7×24 | Gateway Mac distant + OpenRouter | Voie Token + stabilité Provider | 24 h sans coupure ; tokens/jour prévisibles |
| Revue architecture / sécurité | OpenRouter Opus 4.7 | Voie Dollar | Cap journalier ; downgrade auto fin de tâche |
| Programmation lourde | DeepSeek V4 Flash + fallback Opus | Classement prog. + voie Dollar | voir article 26.05. |
| 32 Go mémoire unifiée saturée | Mac distant 128 Go MLX A/B | API vs. local | TTFT et $/1M dans un même tableau |
8. Cas client : équipe Mac de 10 personnes, −38 % sur OpenRouter
« Dix full-stack, MacBook Pro M3 Max 36 Go + Studio M2 Ultra : default Cursor Claude Opus 4.7 (intuition « le meilleur »), OpenClaw sur MiMo, 6 800 $/mois OpenRouter. Début juin, table double voie : 80 % des interactions → MiMo-V2.5 + DeepSeek V4 Flash (voie Token) ; Opus réservé aux revues PR sécurité (voie Dollar, 15 $/personne/jour) ; DeepSeek A/B SiliconFlow vs. officiel, P95 proches → canal le moins cher ; Studio la nuit MLX Qwen 32B pour 40 % des complétions. Après 30 jours : 4 220 $, −38 % ; appels Opus −71 %, satisfaction sur tâches difficiles inchangée. »
Enseignement : la facture explose quand la voie Dollar sert de default, pas parce qu'OpenRouter serait intrinsèquement cher. Les modèles open source chinois du Top Models conviennent au volume ; Opus doit rester la « salle d'urgence », pas le médecin traitant.
9. Perspective : la structure double voie est durable
À 31T tokens/semaine, le marché se scinde entre couche commodity token (open source CN + enchères Provider) et couche premium dollar (Anthropic/Google/OpenAI). Les modèles stealth (Owl Alpha) ~1,5T/sem. prouvent que l'invisibilité au classement n'égale pas l'irrelevance. L'écosystème Mac permet de valider la voie Token en MLX, puis de comparer OpenRouter ; Windows/Linux cloud peinent sur debug local Xcode/Cursor, ColorSync, gateway launchd. Quand agent et IDE se partagent 36 Go : Mac Apple Silicon distant pour la voie Token OpenClaw, portable réservé à la revue et au fallback Dollar.
Pour les équipes créatives et produit, un nœud MACGPU préconfiguré OpenClaw + modèle de table de routage aligne la voie Token avec votre stratégie locale — sans sacrifier la voie Dollar pour les revues critiques.
10. Chiffres citables, FAQ & checklist
① Tokens/semaine (30.05.) : ~31,34T. ② Revenu hebdo : ~32,4 M$. ③ Anthropic ~42 % revenu, ~11 % tokens. ④ Xiaomi ~2,30T (+432 % WoW). ⑤ SiliconFlow ~4,04T. ⑥ Cas client 6 800 $→4 220 $ (−38 %).
Continuer les sous-classements de mai ? Oui — programmation, Tool Calls, multimodal, image restent pertinents ; cet article ajoute double voie + Provider. MiMo remplace Opus ? Non — usage par voie. MACGPU ? Mac distant pour les pics voie Token, portable pour revue et fallback Dollar.
Checklist d'acceptation : (1) Deux tables de routage versionnées. (2) Provider Usage journalisé chaque semaine. (3) Cap voie Dollar actif. (4) 50 prompts de régression avant changement default WoW. (5) POST-115 lié à la série 0525–0529 dans le wiki équipe.