2026 OPENROUTER
TOKEN_
VS_
REVENUE_
MAC.
Auf openrouter.ai/rankings liefern Top Models, Market Share und Trending parallele Signale — Rechnung und „Was ist heiß?“ stimmen selten überein. Die Mai-Serie deckte Gesamtchart, Programming, Tool Calls, Multimodal-Eingabe und Image Output / Languages ab. Anfang Juni 2026 braucht es die Dual-Ranking-Lektüre: Default-Modelle nach Wochen-Token-Volumen wählen vs. Budget nach USD-Umsatz / Stückpreis — zwei getrennte Logiken. Snapshot 30.05.2026 (öffentliche Endpoint-Aggregate): ~31,34T Tokens/Woche, geschätzter Wochenumsatz ~$32,4M; Anthropic ~42 % Umsatz, nur ~11 % Token-Anteil; Xiaomi MiMo-V2.5-Pro ~2,30T (+432 % WoW), Umsatz nur ~$438K. Dieser datengetriebene Leitfaden: Snapshot — Dual-Vergleich — Provider-Schicht — WoW-Alarm — sechs Schritte — Entscheidungsmatrix — Fallstudie — Referenzzahlen & Abnahme.
1. Problemdefinition: Falsches Chart = Kostenexplosion oder Underfitting
(1) Top Models als „stärkstes Modell“: Spitzenreiter MiMo-V2.5, DeepSeek V4, Qwen = günstiger Durchsatz, nicht automatisch beste Reasoning-Qualität. (2) Umsatz-Chart ignoriert: Claude Opus 4.7 kann wenig Token zählen, aber bei $5/$25 pro M das Budget dominieren. (3) Autor ≠ Provider: SiliconFlow ~4,04T Token (knapp hinter Google ~4,28T), Market Share zeigt DeepSeek/Qwen als Basismodell — Ops ändert Provider, nicht nur Modell-ID. (4) WoW-Spike ohne Cap: Xiaomi +432 %, Alibaba +75 % in einer Woche; fest codierte Cursor/OpenClaw-Defaults können ungetestete Fallback-Pfade aktivieren. (5) Kein Split lokal/API: MLX-fähige DeepSeek/Qwen laufen weiter über OpenRouter — Einheitsspeicher leer, API-Rechnung steigt. (6) DSGVO: CN-Provider dominieren Token-Volumen (>60 %); für EU-Teams ist Market Share ein Routing-Signal, kein Rechtsurteil — Verarbeitungszwecke, AVV und ggf. US-Routing (Anthropic) separat dokumentieren.
2. Drei Sätze: OpenRouter-Gesamtstand Anfang Juni 2026
| Dimension | Snapshot 30.05. (öffentliche Aggregate) | Mac-Lektüre |
|---|---|---|
| Gesamt-Durchsatz | ~31,34T Tokens/Woche; ~$32,4M Wochenumsatz (Schätzung) | Agent-Skalierung = Budget-Buckets pflichtig |
| Token #1 Provider | Google ~4,28T; SiliconFlow ~4,04T | Provider-Stabilität messen, nicht nur Modellname |
| Token-Spike WoW | Xiaomi +432 %; Stealth/Owl ~1,58T neu | Wöchentliches Diff Default + Fallback |
| Umsatz #1 | Anthropic ~42 % (~$13,6M/Woche) | Schwere Tasks, kein Tages-Default |
| CN-Token-Anteil | zusammen >60 % (mehrere Quellen) | kosteneffizient; Compliance separat |
3. Dual-Vergleich: Volumen-Könige vs. Umsatz-Könige
| Spur | Repräsentanten | Wochen-Token (ca.) | Wochenumsatz (ca.) | Typischer Mac-Use-Case |
|---|---|---|---|---|
| Volumen | MiMo-V2.5-Pro, DeepSeek V4 Pro, Qwen 3.6+ | Xiaomi 2,30T; DeepSeek 1,32T | Xiaomi ~$438K; DeepSeek ~$219K | Cursor-Completion, OpenClaw 7×24 Agent |
| Umsatz | Claude Opus 4.7, GPT-5.5 | Anthropic 3,51T (Familie) | Anthropic ~$13,6M (42 %) | Architektur-Review, schwere Bugs, Compliance |
| Mismatch | Google-Routing + Claude-Preis | Google höchstes Token-Volumen | Bedrock/Azure + Anthropic-Tarif | IDE: tatsächlichen Provider prüfen |
Fazit: Top Models / Market Share für günstige Defaults; Umsatzstruktur für Teuer-Modell-Quotas. Beides gilt parallel — die Plattform trennt „Commodity Token“ und „Premium Dollar“; Mac-Teams pflegen zwei Routing-Tabellen, nicht eine.
4. Provider-Schicht: SiliconFlow, Novita ≠ Autor-Chart
Market Share schneidet nach Modellautor (Xiaomi, Qwen, Anthropic); Requests laufen über Provider (SiliconFlow, Novita, DeepInfra, Direkt). Snapshot 30.05.: SiliconFlow ~4,04T Token, Umsatz nur ~$609K → massiver Billig-Kanal-Traffic; Novita ~1,77T, WoW −19 % → Provider rotieren wöchentlich. Bei OpenRouter-Konfiguration neben model den tatsächlich getroffenen Provider im Usage-Panel loggen — gleicher Modellname, unterschiedliche P95-Latenz und Rate-Limits.
5. WoW-Alarm: Fallback bei Token-Explosion
Eine Woche: Xiaomi +1,87T (+432 %), Alibaba +612B (+75 %); StepFun, Novita, Moonshot fallen. Empfehlung für OpenClaw / Cursor — dreistufiges Fallback: ① Default MiMo-V2.5 oder DeepSeek V4 Flash (Volumen-Chart + niedriger $/M); ② Qualität Qwen3.7 / GLM-5; ③ Notfall Claude Opus 4.7 (tägliches Token-Cap). In Spike-Wochen kein unbegrenztes Auto-Upgrade — zuerst 50 Regressions-Prompts auf Remote-Mac oder lokal, dann Produktion.
6. Sechs Schritte: Dual-Charts → Mac-Routing-Tabelle
Schritt 1 — Wöchentlich Rankings + Usage
Top Models Top-5 vs. eigene Rechnung Top-3; Abweichung = falsche Spur aktiv.
Schritt 2 — Token-Spur und Dollar-Spur trennen
Token-Spur: Default + Agent; Dollar-Spur: Opus/GPT mit Tages-Cap (z. B. $20/Tag).
Schritt 3 — Provider annotieren
Für DeepSeek V4 Pro SiliconFlow vs. offiziell — P95-Latenz vergleichen.
Schritt 4 — MLX-Lokalreferenz
Quantisierbare Qwen/DeepSeek klein tagsüber über lokales /v1, Nacht-Agent über OpenRouter.
Schritt 5 — openclaw.json alignen
Primärmodell und Fallback-Arrays pro Spur; siehe Fallback-Drift-Runbook.
Schritt 6 — Bei 429 zuerst runter, dann hoch
Token-Spur-Backup, dann Dollar-Spur — nicht sofort Opus für alles.
7. Drei-Spur-Matrix: MLX lokal / OpenRouter API / Remote Mac
| Szenario | Pfad | Welches Chart | Abnahme (messbar) |
|---|---|---|---|
| IDE-Tages-Completion | Ollama/MLX lokal oder OpenRouter Billiglinie | Token-Spur Top-5 | P95 <800ms; <$0,3/M effektiv |
| OpenClaw 7×24 Agent | Remote-Mac-Gateway + OpenRouter | Token-Spur + Provider-Stabilität | 24h ohne Disconnect; planbare Tages-Tokens |
| Architektur / Security Review | OpenRouter Opus 4.7 | Dollar-Spur | Tages-Cap; Auto-Downgrade nach Task |
| Schwere Coding-Tasks | DeepSeek V4 Flash + Opus Fallback | Programming-Chart + Dollar-Spur | siehe Post 26.05. |
| 32GB Unified Memory voll | Remote Mac 128GB MLX A/B | API vs. lokal | TTFT und $/1M in einer Tabelle |
8. Fallstudie: 10-köpfiges Mac-Team, OpenRouter −38 %
„10 Full-Stack, MacBook Pro M3 Max 36GB + Studio M2 Ultra: Cursor-Default Claude Opus 4.7 (‚Intuition‘), OpenClaw MiMo, $6.800/Monat OpenRouter. Anfang Juni Dual-Tabelle: 80 % Interaktionen → MiMo-V2.5 + DeepSeek V4 Flash (Token-Spur); Opus nur PR-Security-Review (Dollar-Spur $15/Person/Tag); DeepSeek SiliconFlow vs. offiziell A/B, P95 ähnlich → günstiger Kanal; Studio nachts MLX Qwen 32B für 40 % Completions. Nach 30 Tagen: $4.220, −38 %; Opus-Aufrufe −71 %, schwere Task-Zufriedenheit unverändert.“
Kernmetrik: Hauptkosten = Dollar-Spur als Default, nicht „OpenRouter ist teuer“. CN-Open-Source auf Top Models eignet sich für Volumen; Opus = Notaufnahme, nicht Hausarzt.
9. Prognose: Dual-Struktur bleibt dauerhaft
Bei 31T Tokens/Woche spaltet sich der Markt in Commodity-Token (CN-Open-Source + Provider-Wettbewerb) und Premium-Dollar (Anthropic/Google/OpenAI). Stealth-Modelle (Owl Alpha) ~1,5T/Woche zeigen: unsichtbare Chart-Position ≠ irrelevant. Mac-Vorteil: MLX-Validierung der Token-Spur, dann OpenRouter-A/B; Windows/Linux-Cloud fehlt Xcode/Cursor-Lokaldebug, ColorSync, launchd-Gateway. Bei 36GB-Konkurrenz Agent+IDE: Remote Apple Silicon für OpenClaw Token-Spur, Laptop nur Review und Dollar-Spur.
Für DSGVO-sensible EU-Teams: CN-Token-Dominanz erfordert dokumentierte Datenflüsse; Anthropic-US-Routing separat bewerten. MACGPU Remote-Mac-Knoten mit OpenClaw + Routing-Vorlage alignen die Token-Spur mit lokaler Abnahme.
10. Referenzzahlen, FAQ & Abnahme
① Wochen-Token (30.05.): ~31,34T. ② Wochenumsatz: ~$32,4M. ③ Anthropic Umsatz ~42 %, Token ~11 %. ④ Xiaomi ~2,30T (+432 % WoW). ⑤ SiliconFlow ~4,04T. ⑥ Fallstudie $6.800→$4.220 (−38 %).
Mai-Subcharts noch lesen? Ja — Programming/Tool/Multimodal/Image Output bleiben; dieser Post ergänzt Dual-Ranking + Provider. MiMo ersetzt Opus? Nein — Spur-Trennung. MACGPU? Remote Mac für Token-Spur-Peaks, Laptop für Dollar-Spur und MLX-Referenz.
Abnahme-Checkliste: (1) Zwei Routing-Tabellen versioniert. (2) Usage-Provider wöchentlich geloggt. (3) Dollar-Spur Hard-Cap aktiv. (4) 50-Prompt-Regression vor WoW-Default-Wechsel. (5) DSGVO-Notiz zu CN/US-Provider. (6) POST-115 im Wiki verlinkt zu 0525–0529-Serie.