OpenRouter Juni 2026 Dual-Ranking: Token-Volumen vs. Umsatz, MiMo-V2.5 & Claude Opus — Mac-Routing für Cursor / OpenClaw

Auf openrouter.ai/rankings liefern Top Models, Market Share und Trending parallele Signale — Rechnung und „Was ist heiß?“ stimmen selten überein. Die Mai-Serie deckte Gesamtchart, Programming, Tool Calls, Multimodal-Eingabe und Image Output / Languages ab. Anfang Juni 2026 braucht es die Dual-Ranking-Lektüre: Default-Modelle nach Wochen-Token-Volumen wählen vs. Budget nach USD-Umsatz / Stückpreis — zwei getrennte Logiken. Snapshot 30.05.2026 (öffentliche Endpoint-Aggregate): ~31,34T Tokens/Woche, geschätzter Wochenumsatz ~$32,4M; Anthropic ~42 % Umsatz, nur ~11 % Token-Anteil; Xiaomi MiMo-V2.5-Pro ~2,30T (+432 % WoW), Umsatz nur ~$438K. Dieser datengetriebene Leitfaden: Snapshot — Dual-Vergleich — Provider-Schicht — WoW-Alarm — sechs Schritte — Entscheidungsmatrix — Fallstudie — Referenzzahlen & Abnahme.

1. Problemdefinition: Falsches Chart = Kostenexplosion oder Underfitting

(1) Top Models als „stärkstes Modell“: Spitzenreiter MiMo-V2.5, DeepSeek V4, Qwen = günstiger Durchsatz, nicht automatisch beste Reasoning-Qualität. (2) Umsatz-Chart ignoriert: Claude Opus 4.7 kann wenig Token zählen, aber bei $5/$25 pro M das Budget dominieren. (3) Autor ≠ Provider: SiliconFlow ~4,04T Token (knapp hinter Google ~4,28T), Market Share zeigt DeepSeek/Qwen als Basismodell — Ops ändert Provider, nicht nur Modell-ID. (4) WoW-Spike ohne Cap: Xiaomi +432 %, Alibaba +75 % in einer Woche; fest codierte Cursor/OpenClaw-Defaults können ungetestete Fallback-Pfade aktivieren. (5) Kein Split lokal/API: MLX-fähige DeepSeek/Qwen laufen weiter über OpenRouter — Einheitsspeicher leer, API-Rechnung steigt. (6) DSGVO: CN-Provider dominieren Token-Volumen (>60 %); für EU-Teams ist Market Share ein Routing-Signal, kein Rechtsurteil — Verarbeitungszwecke, AVV und ggf. US-Routing (Anthropic) separat dokumentieren.

2. Drei Sätze: OpenRouter-Gesamtstand Anfang Juni 2026

Dimension	Snapshot 30.05. (öffentliche Aggregate)	Mac-Lektüre
Gesamt-Durchsatz	~31,34T Tokens/Woche; ~$32,4M Wochenumsatz (Schätzung)	Agent-Skalierung = Budget-Buckets pflichtig
Token #1 Provider	Google ~4,28T; SiliconFlow ~4,04T	Provider-Stabilität messen, nicht nur Modellname
Token-Spike WoW	Xiaomi +432 %; Stealth/Owl ~1,58T neu	Wöchentliches Diff Default + Fallback
Umsatz #1	Anthropic ~42 % (~$13,6M/Woche)	Schwere Tasks, kein Tages-Default
CN-Token-Anteil	zusammen >60 % (mehrere Quellen)	kosteneffizient; Compliance separat

3. Dual-Vergleich: Volumen-Könige vs. Umsatz-Könige

Spur	Repräsentanten	Wochen-Token (ca.)	Wochenumsatz (ca.)	Typischer Mac-Use-Case
Volumen	MiMo-V2.5-Pro, DeepSeek V4 Pro, Qwen 3.6+	Xiaomi 2,30T; DeepSeek 1,32T	Xiaomi ~$438K; DeepSeek ~$219K	Cursor-Completion, OpenClaw 7×24 Agent
Umsatz	Claude Opus 4.7, GPT-5.5	Anthropic 3,51T (Familie)	Anthropic ~$13,6M (42 %)	Architektur-Review, schwere Bugs, Compliance
Mismatch	Google-Routing + Claude-Preis	Google höchstes Token-Volumen	Bedrock/Azure + Anthropic-Tarif	IDE: tatsächlichen Provider prüfen

Fazit: Top Models / Market Share für günstige Defaults; Umsatzstruktur für Teuer-Modell-Quotas. Beides gilt parallel — die Plattform trennt „Commodity Token“ und „Premium Dollar“; Mac-Teams pflegen zwei Routing-Tabellen, nicht eine.

4. Provider-Schicht: SiliconFlow, Novita ≠ Autor-Chart

Market Share schneidet nach Modellautor (Xiaomi, Qwen, Anthropic); Requests laufen über Provider (SiliconFlow, Novita, DeepInfra, Direkt). Snapshot 30.05.: SiliconFlow ~4,04T Token, Umsatz nur ~$609K → massiver Billig-Kanal-Traffic; Novita ~1,77T, WoW −19 % → Provider rotieren wöchentlich. Bei OpenRouter-Konfiguration neben model den tatsächlich getroffenen Provider im Usage-Panel loggen — gleicher Modellname, unterschiedliche P95-Latenz und Rate-Limits.

5. WoW-Alarm: Fallback bei Token-Explosion

Eine Woche: Xiaomi +1,87T (+432 %), Alibaba +612B (+75 %); StepFun, Novita, Moonshot fallen. Empfehlung für OpenClaw / Cursor — dreistufiges Fallback: ① Default MiMo-V2.5 oder DeepSeek V4 Flash (Volumen-Chart + niedriger $/M); ② Qualität Qwen3.7 / GLM-5; ③ Notfall Claude Opus 4.7 (tägliches Token-Cap). In Spike-Wochen kein unbegrenztes Auto-Upgrade — zuerst 50 Regressions-Prompts auf Remote-Mac oder lokal, dann Produktion.

6. Sechs Schritte: Dual-Charts → Mac-Routing-Tabelle

Schritt 1 — Wöchentlich Rankings + Usage

Top Models Top-5 vs. eigene Rechnung Top-3; Abweichung = falsche Spur aktiv.

Schritt 2 — Token-Spur und Dollar-Spur trennen

Token-Spur: Default + Agent; Dollar-Spur: Opus/GPT mit Tages-Cap (z. B. $20/Tag).

Schritt 3 — Provider annotieren

Für DeepSeek V4 Pro SiliconFlow vs. offiziell — P95-Latenz vergleichen.

Schritt 4 — MLX-Lokalreferenz

Quantisierbare Qwen/DeepSeek klein tagsüber über lokales /v1, Nacht-Agent über OpenRouter.

Schritt 5 — openclaw.json alignen

Primärmodell und Fallback-Arrays pro Spur; siehe Fallback-Drift-Runbook.

Schritt 6 — Bei 429 zuerst runter, dann hoch

Token-Spur-Backup, dann Dollar-Spur — nicht sofort Opus für alles.

# Cursor / OpenAI-kompatibel: OpenRouter Multi-Modell-Routing
export OPENAI_BASE_URL="https://openrouter.ai/api/v1"
export OPENAI_API_KEY="$OPENROUTER_API_KEY"
# Default: Volumen-Chart (günstig)
export OPENAI_MODEL="xiaomi/mimo-v2.5-pro"
# Schwere Tasks: separates Profil → anthropic/claude-opus-4.7
                

7. Drei-Spur-Matrix: MLX lokal / OpenRouter API / Remote Mac

Szenario	Pfad	Welches Chart	Abnahme (messbar)
IDE-Tages-Completion	Ollama/MLX lokal oder OpenRouter Billiglinie	Token-Spur Top-5	P95 <800ms; <$0,3/M effektiv
OpenClaw 7×24 Agent	Remote-Mac-Gateway + OpenRouter	Token-Spur + Provider-Stabilität	24h ohne Disconnect; planbare Tages-Tokens
Architektur / Security Review	OpenRouter Opus 4.7	Dollar-Spur	Tages-Cap; Auto-Downgrade nach Task
Schwere Coding-Tasks	DeepSeek V4 Flash + Opus Fallback	Programming-Chart + Dollar-Spur	siehe Post 26.05.
32GB Unified Memory voll	Remote Mac 128GB MLX A/B	API vs. lokal	TTFT und $/1M in einer Tabelle

8. Fallstudie: 10-köpfiges Mac-Team, OpenRouter −38 %

„10 Full-Stack, MacBook Pro M3 Max 36GB + Studio M2 Ultra: Cursor-Default Claude Opus 4.7 (‚Intuition‘), OpenClaw MiMo, $6.800/Monat OpenRouter. Anfang Juni Dual-Tabelle: 80 % Interaktionen → MiMo-V2.5 + DeepSeek V4 Flash (Token-Spur); Opus nur PR-Security-Review (Dollar-Spur $15/Person/Tag); DeepSeek SiliconFlow vs. offiziell A/B, P95 ähnlich → günstiger Kanal; Studio nachts MLX Qwen 32B für 40 % Completions. Nach 30 Tagen: $4.220, −38 %; Opus-Aufrufe −71 %, schwere Task-Zufriedenheit unverändert.“

Kernmetrik: Hauptkosten = Dollar-Spur als Default, nicht „OpenRouter ist teuer“. CN-Open-Source auf Top Models eignet sich für Volumen; Opus = Notaufnahme, nicht Hausarzt.

9. Prognose: Dual-Struktur bleibt dauerhaft

Bei 31T Tokens/Woche spaltet sich der Markt in Commodity-Token (CN-Open-Source + Provider-Wettbewerb) und Premium-Dollar (Anthropic/Google/OpenAI). Stealth-Modelle (Owl Alpha) ~1,5T/Woche zeigen: unsichtbare Chart-Position ≠ irrelevant. Mac-Vorteil: MLX-Validierung der Token-Spur, dann OpenRouter-A/B; Windows/Linux-Cloud fehlt Xcode/Cursor-Lokaldebug, ColorSync, launchd-Gateway. Bei 36GB-Konkurrenz Agent+IDE: Remote Apple Silicon für OpenClaw Token-Spur, Laptop nur Review und Dollar-Spur.

Für DSGVO-sensible EU-Teams: CN-Token-Dominanz erfordert dokumentierte Datenflüsse; Anthropic-US-Routing separat bewerten. MACGPU Remote-Mac-Knoten mit OpenClaw + Routing-Vorlage alignen die Token-Spur mit lokaler Abnahme.

10. Referenzzahlen, FAQ & Abnahme

① Wochen-Token (30.05.): ~31,34T. ② Wochenumsatz: ~$32,4M. ③ Anthropic Umsatz ~42 %, Token ~11 %. ④ Xiaomi ~2,30T (+432 % WoW). ⑤ SiliconFlow ~4,04T. ⑥ Fallstudie $6.800→$4.220 (−38 %).

Mai-Subcharts noch lesen? Ja — Programming/Tool/Multimodal/Image Output bleiben; dieser Post ergänzt Dual-Ranking + Provider. MiMo ersetzt Opus? Nein — Spur-Trennung. MACGPU? Remote Mac für Token-Spur-Peaks, Laptop für Dollar-Spur und MLX-Referenz.

Abnahme-Checkliste: (1) Zwei Routing-Tabellen versioniert. (2) Usage-Provider wöchentlich geloggt. (3) Dollar-Spur Hard-Cap aktiv. (4) 50-Prompt-Regression vor WoW-Default-Wechsel. (5) DSGVO-Notiz zu CN/US-Provider. (6) POST-115 im Wiki verlinkt zu 0525–0529-Serie.