2026 OPENROUTER
TOOL_
CALLS_
AGENT_
MAC.
Sur openrouter.ai/rankings, OpenRouter a annoncé le 26 mai 2026 une Series B de 113 M$, avec environ 25 billions de tokens traités par semaine (contre ~5T/semaine il y a six mois). Les classements ne mesurent plus seulement « qui chatte le plus ». Au-delà du global et de Programming, ce sont Tool Calls, le Market Share par éditeur et le volume quotidien Agent/App qui orientent les équipes Mac utilisant OpenClaw, Hermes ou Cursor Agent. Vers le 10 mai, Hermes Agent a atteint ~224B tokens/jour et dépassé OpenClaw (~186B), tandis qu'OpenClaw reste leader cumulé avec ~9,17T contre ~6,35T pour Hermes — un renversement quotidien, pas un changement d'écosystème. Cet article propose une lecture professionnelle : interprétation des classements — snapshot Tool Calls — bascule Agent — parts de marché — routage Mac en trois voies — six étapes — critères d'acceptation. Liens internes : matrice globale de mai, classement Programmation, failover OpenClaw 429.
1. Problématique : le classement global ne suffit pas aux Agents ; Programming ne couvre pas les Tool Calls
Le décalage dimensionnel est net : le #1 global MiMo-V2-Pro excelle en conversation générale, pas en stabilité des tool calls. Programming mesure le trafic code IDE, pas les chaînes exec / MCP / navigateur / système de fichiers. Le runtime Agent diffère du modèle de base : la progression quotidienne d'Hermes reflète l'attrait de l'auto-amélioration et de la mémoire persistante, alors qu'OpenClaw conserve ClawHub, le multi-canal et launchd comme référence production. Les Tool Calls coûtent cher : un tour Agent compte souvent 8 à 20 allers-retours outil, soit 3 à 5× les tokens d'un chat pur. Un Mac ne peut pas héberger localement les modèles en tête du classement Tool Calls ; seuls des modèles ~30B servent de filtre. Enfin, sans mise à jour hebdomadaire de openclaw.json et des fallbacks OpenRouter, un failover 429 vous laisse sur un modèle hors classement.
2. Lire les classements multidimensionnels OpenRouter (fin mai 2026)
| Tranche | Question adressée | Action Mac typique |
|---|---|---|
| Top Models | Leaders hebdomadaires | Chat/API par défaut (article 25/05) |
| Programming | Trafic IDE | Routes Cursor/Cline (article 26/05) |
| Tool Calls | Modèles portant le trafic tools | Primary + fallback OpenClaw/Hermes |
| Market Share | Part par éditeur | Coût et conformité |
| Tokens Agent/jour | Runtime Agent le plus actif | Hermes vs OpenClaw vs IDE Agent |
Recommandation opérationnelle : aligner chaque lundi Tool Calls + classement Agent quotidien ; revoir mensuellement le Market Share pour un éventuel changement d'éditeur principal.
3. Snapshot Tool Calls (semaine 2026-05-27, angle workflow Agent)
| Niveau | Modèles (ID OpenRouter) | Atout | Chemin Mac |
|---|---|---|---|
| T1 débit/coût | deepseek-v4-flash, gemini-3-flash-preview | Boucles tool multi-étapes | API ; Qwen3 30B local en pré-filtre |
| T2 équilibre | claude-sonnet-4.6, kimi-k2.6 | Chaînes Agent longues | API ; Kimi sur Mac distant |
| T3 tâches difficiles | claude-opus-4.7, gpt-5.5-pro | MCP complexe | API + plafond $/jour |
| T4 OSS | qwen3.7-max, mimo-v2-pro | Audit, gateway maison | Mac distant 128GB+ |
Chevauchement Tool Calls / Programming ~50–60 %, ordre différent. Séparez tools.profile et modèle principal dans openclaw.json : T1/T2 en primary, T3 en fallback.
4. Classement Agent : Hermes quotidien vs OpenClaw cumulé
| Indicateur | Hermes | OpenClaw | Choix |
|---|---|---|---|
| Tokens/jour (~10/05) | ~224B | ~186B | Quotidien : momentum Hermes |
| Cumulé | ~6,35T | ~9,17T | Écosystème : OpenClaw |
| Mémoire | Trois couches + SQLite FTS | MEMORY.md externe | Long terme → Hermes |
| Production Mac | Stack récent, docs limitées | launchd, ClawHub, runbooks | 7×24 → OpenClaw |
Suivre le quotidien pour l'expérimentation ; le cumulé et la maturité ops pour les canaux 7×24. Les deux peuvent partager une clé OpenRouter et le même primary Tool Calls.
5. Market Share et 25T/semaine : implications pour Mac
Les modèles d'origine chinoise dépasseraient 45 % du volume OpenRouter (contre ~2 % il y a un an). Volume hebdomadaire ~25T tokens. Aucun éditeur >25 % — le failover au niveau éditeur via OpenRouter est viable. Primary Tool Calls T1 ; backup chez un autre éditeur (ex. Anthropic Sonnet).
6. Six étapes : du classement Tool Calls à la stack Agent Mac
Étape 1 — Snapshot hebdomadaire
Consulter openrouter.ai/rankings (Tool Calls, Market Share) ; archiver GET /api/v1/models?supported_parameters=tools.
Étape 2 — Quatre buckets de charge
Léger (1–3) / standard (4–10) / MCP lourd (10+) / multimodal — primary + backup T1–T3 par bucket.
Étape 3 — Aligner openclaw.json
T1 primary, fallbacks T2→T3, tools.profile limitant exec, Gateway https://openrouter.ai/api/v1.
Étape 4 — Hermes / Cursor : même clé, runtime distinct
Sandbox Hermes avec le même T1 que la production.
Étape 5 — Local 30B + Mac distant 128GB
Qwen3 30B pour pré-validation ; 72B ou Kimi sur Mac distant via tunnel SSH.
Étape 6 — Sonde 30 min + plafond journalier
Succès tool >90 %, p95 <45 s, $/day hard cap OpenRouter.
7. Matrice trois voies : local / Mac distant / API OpenRouter
| Scénario | Voie | Acceptation |
|---|---|---|
| Tool léger / pré-check | MLX local Qwen3 30B | JSON valide >95 % |
| Canaux 7×24 | Mac distant + OpenClaw | 429 <1 %/jour |
| MCP lourd | OpenRouter T1→T3 | p95 <60 s |
| Expérience Hermes | Même T1 | Mémoire <500 ms |
| Pic de charge | Mac distant 128GB | 6 h sans OOM |
8. Étude de cas : réorganisation OpenClaw via Tool Calls, −41 % de tokens Agent
Équipe ops de six personnes, OpenClaw sur Telegram et messagerie d'entreprise, Opus 4.7 en primary, facture OpenRouter 4 100 $/mois. Mi-mai, reconfiguration selon le classement Tool Calls : deepseek-v4-flash par défaut, Sonnet 4.6 uniquement pour sessions browser+exec, Opus réservé à /deep-debug manuel. Gateway migré vers MACGPU M4 Max 128GB distant ; MacBook local en SSH uniquement. Après 30 jours : tokens Agent mensuels 820B→480B, facture 2 420 $ (−41 %) ; échecs tool 4,2 %→2,1 % grâce au pré-filtre local 30B.
Le coût Agent dépend des tours tool × prix du modèle, pas de la marque du framework. Le Mac distant isole Gateway et charge lourde de la mémoire unifiée du portable.
9. Perspective : deux classements parallèles — runtime vs modèle tool-calling
25T/semaine confirme le pivot vers l'infrastructure Agent. Mac offre un avantage distinct : Gateway, pré-filtre MLX et workloads média sur une mémoire unifiée. Lorsque 72B ne tient pas en local 32GB, un Mac Apple Silicon distant MACGPU (M3/M4 Max 128GB) maintient les modèles Tool Calls dans le LAN.
10. Chiffres citables et FAQ
25T/semaine · Hermes vs OpenClaw quotidien 224B vs 186B · OpenClaw cumulé ~9,17T · part modèles chinois >45 % · multiplicateur tool 3–5× · 4 100→2 420 $.
Surveiller le global ? Oui, mais le routage Agent mène avec Tool Calls. Hermes remplace OpenClaw ? Quotidien = tendance ; production = ops — coexistence possible. Tool Calls #1 en local ? Souvent API-only ; 30B en assistance. MACGPU ? Gateway 7×24 distant + MLX grande capacité.