OpenRouter fin mai 2026 — Tool Calls et classement Agents : Hermes dépasse OpenClaw en tokens quotidiens — routage Mac Agent à 25T tokens/semaine

Sur openrouter.ai/rankings, OpenRouter a annoncé le 26 mai 2026 une Series B de 113 M$, avec environ 25 billions de tokens traités par semaine (contre ~5T/semaine il y a six mois). Les classements ne mesurent plus seulement « qui chatte le plus ». Au-delà du global et de Programming, ce sont Tool Calls, le Market Share par éditeur et le volume quotidien Agent/App qui orientent les équipes Mac utilisant OpenClaw, Hermes ou Cursor Agent. Vers le 10 mai, Hermes Agent a atteint ~224B tokens/jour et dépassé OpenClaw (~186B), tandis qu'OpenClaw reste leader cumulé avec ~9,17T contre ~6,35T pour Hermes — un renversement quotidien, pas un changement d'écosystème. Cet article propose une lecture professionnelle : interprétation des classements — snapshot Tool Calls — bascule Agent — parts de marché — routage Mac en trois voies — six étapes — critères d'acceptation. Liens internes : matrice globale de mai, classement Programmation, failover OpenClaw 429.

1. Problématique : le classement global ne suffit pas aux Agents ; Programming ne couvre pas les Tool Calls

Le décalage dimensionnel est net : le #1 global MiMo-V2-Pro excelle en conversation générale, pas en stabilité des tool calls. Programming mesure le trafic code IDE, pas les chaînes exec / MCP / navigateur / système de fichiers. Le runtime Agent diffère du modèle de base : la progression quotidienne d'Hermes reflète l'attrait de l'auto-amélioration et de la mémoire persistante, alors qu'OpenClaw conserve ClawHub, le multi-canal et launchd comme référence production. Les Tool Calls coûtent cher : un tour Agent compte souvent 8 à 20 allers-retours outil, soit 3 à 5× les tokens d'un chat pur. Un Mac ne peut pas héberger localement les modèles en tête du classement Tool Calls ; seuls des modèles ~30B servent de filtre. Enfin, sans mise à jour hebdomadaire de openclaw.json et des fallbacks OpenRouter, un failover 429 vous laisse sur un modèle hors classement.

2. Lire les classements multidimensionnels OpenRouter (fin mai 2026)

Tranche	Question adressée	Action Mac typique
Top Models	Leaders hebdomadaires	Chat/API par défaut (article 25/05)
Programming	Trafic IDE	Routes Cursor/Cline (article 26/05)
Tool Calls	Modèles portant le trafic tools	Primary + fallback OpenClaw/Hermes
Market Share	Part par éditeur	Coût et conformité
Tokens Agent/jour	Runtime Agent le plus actif	Hermes vs OpenClaw vs IDE Agent

Recommandation opérationnelle : aligner chaque lundi Tool Calls + classement Agent quotidien ; revoir mensuellement le Market Share pour un éventuel changement d'éditeur principal.

3. Snapshot Tool Calls (semaine 2026-05-27, angle workflow Agent)

Niveau	Modèles (ID OpenRouter)	Atout	Chemin Mac
T1 débit/coût	deepseek-v4-flash, gemini-3-flash-preview	Boucles tool multi-étapes	API ; Qwen3 30B local en pré-filtre
T2 équilibre	claude-sonnet-4.6, kimi-k2.6	Chaînes Agent longues	API ; Kimi sur Mac distant
T3 tâches difficiles	claude-opus-4.7, gpt-5.5-pro	MCP complexe	API + plafond $/jour
T4 OSS	qwen3.7-max, mimo-v2-pro	Audit, gateway maison	Mac distant 128GB+

Chevauchement Tool Calls / Programming ~50–60 %, ordre différent. Séparez tools.profile et modèle principal dans openclaw.json : T1/T2 en primary, T3 en fallback.

4. Classement Agent : Hermes quotidien vs OpenClaw cumulé

Indicateur	Hermes	OpenClaw	Choix
Tokens/jour (~10/05)	~224B	~186B	Quotidien : momentum Hermes
Cumulé	~6,35T	~9,17T	Écosystème : OpenClaw
Mémoire	Trois couches + SQLite FTS	MEMORY.md externe	Long terme → Hermes
Production Mac	Stack récent, docs limitées	launchd, ClawHub, runbooks	7×24 → OpenClaw

Suivre le quotidien pour l'expérimentation ; le cumulé et la maturité ops pour les canaux 7×24. Les deux peuvent partager une clé OpenRouter et le même primary Tool Calls.

5. Market Share et 25T/semaine : implications pour Mac

Les modèles d'origine chinoise dépasseraient 45 % du volume OpenRouter (contre ~2 % il y a un an). Volume hebdomadaire ~25T tokens. Aucun éditeur >25 % — le failover au niveau éditeur via OpenRouter est viable. Primary Tool Calls T1 ; backup chez un autre éditeur (ex. Anthropic Sonnet).

6. Six étapes : du classement Tool Calls à la stack Agent Mac

Étape 1 — Snapshot hebdomadaire

Consulter openrouter.ai/rankings (Tool Calls, Market Share) ; archiver GET /api/v1/models?supported_parameters=tools.

Étape 2 — Quatre buckets de charge

Léger (1–3) / standard (4–10) / MCP lourd (10+) / multimodal — primary + backup T1–T3 par bucket.

Étape 3 — Aligner openclaw.json

T1 primary, fallbacks T2→T3, tools.profile limitant exec, Gateway https://openrouter.ai/api/v1.

Étape 4 — Hermes / Cursor : même clé, runtime distinct

Sandbox Hermes avec le même T1 que la production.

Étape 5 — Local 30B + Mac distant 128GB

Qwen3 30B pour pré-validation ; 72B ou Kimi sur Mac distant via tunnel SSH.

Étape 6 — Sonde 30 min + plafond journalier

Succès tool >90 %, p95 <45 s, $/day hard cap OpenRouter.

curl -s "https://openrouter.ai/api/v1/models" \
  | jq '.data[] | select(.supported_parameters[]? == "tools")
        | {id, pricing, context_length}' \
  > /tmp/or-tools-$(date +%Y%m%d).json

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "deepseek/deepseek-v4-flash",
        "fallbacks": [
          "google/gemini-3-flash-preview",
          "anthropic/claude-sonnet-4.6",
          "anthropic/claude-opus-4.7"
        ]
      }
    }
  }
}
                

7. Matrice trois voies : local / Mac distant / API OpenRouter

Scénario	Voie	Acceptation
Tool léger / pré-check	MLX local Qwen3 30B	JSON valide >95 %
Canaux 7×24	Mac distant + OpenClaw	429 <1 %/jour
MCP lourd	OpenRouter T1→T3	p95 <60 s
Expérience Hermes	Même T1	Mémoire <500 ms
Pic de charge	Mac distant 128GB	6 h sans OOM

8. Étude de cas : réorganisation OpenClaw via Tool Calls, −41 % de tokens Agent

Équipe ops de six personnes, OpenClaw sur Telegram et messagerie d'entreprise, Opus 4.7 en primary, facture OpenRouter 4 100 $/mois. Mi-mai, reconfiguration selon le classement Tool Calls : deepseek-v4-flash par défaut, Sonnet 4.6 uniquement pour sessions browser+exec, Opus réservé à /deep-debug manuel. Gateway migré vers MACGPU M4 Max 128GB distant ; MacBook local en SSH uniquement. Après 30 jours : tokens Agent mensuels 820B→480B, facture 2 420 $ (−41 %) ; échecs tool 4,2 %→2,1 % grâce au pré-filtre local 30B.

Le coût Agent dépend des tours tool × prix du modèle, pas de la marque du framework. Le Mac distant isole Gateway et charge lourde de la mémoire unifiée du portable.

9. Perspective : deux classements parallèles — runtime vs modèle tool-calling

25T/semaine confirme le pivot vers l'infrastructure Agent. Mac offre un avantage distinct : Gateway, pré-filtre MLX et workloads média sur une mémoire unifiée. Lorsque 72B ne tient pas en local 32GB, un Mac Apple Silicon distant MACGPU (M3/M4 Max 128GB) maintient les modèles Tool Calls dans le LAN.

10. Chiffres citables et FAQ

25T/semaine · Hermes vs OpenClaw quotidien 224B vs 186B · OpenClaw cumulé ~9,17T · part modèles chinois >45 % · multiplicateur tool 3–5× · 4 100→2 420 $.

Surveiller le global ? Oui, mais le routage Agent mène avec Tool Calls. Hermes remplace OpenClaw ? Quotidien = tendance ; production = ops — coexistence possible. Tool Calls #1 en local ? Souvent API-only ; 30B en assistance. MACGPU ? Gateway 7×24 distant + MLX grande capacité.