OpenRouter Juni 2026: Zehn-Dimensionen-Wochen-Snapshot — Programming Collections vs. Top Models, Mac-Routing für Cursor/OpenClaw

Auf openrouter.ai/rankings ändern viele Teams den Cursor-Default nach Top Models #1 — die Juni-2026-Telemetrie ist jedoch längst slice-spezifisch: Gesamtchart #1 oft MiMo-V2.5-Pro, während Programming Collections (Update Juni 2026) von DeepSeek V4 Flash und Tencent Hy3 preview angeführt werden. Gemessene Plattform-Wochenlast: 25T–31,34T Tokens; chinesische Anbieter (Xiaomi, Alibaba, DeepSeek u. a.) aggregiert 60 %+ Volumen. Dieser datengetriebene Leitfaden liefert den vollständigen Zehn-Dimensionen-Wochen-Snapshot für Mac-Teams: wann Top Models, wann Collections/Slices, wie OpenClaw/Cursor wöchentlich aktualisieren. Fazit: Rankings als Routing-Konfigurationstabelle — pro Task-Typ die passende Dimension; Gesamtchart-#1 darf Programming- und Agent-Ketten nicht überschreiben. Inhalt: Pain Points — Zehn-Dimensionen-Übersicht — Juni-Versatz — sechs Schritte — Matrix — Fallstudie — Abnahme. Für EU-Teams: Anbieter-Konzentration und DSGVO-/AVV-Dokumentation bei chinesischen Modellen separat bewerten; Stabilität vor Spike-Jagd.

1. Pain Points: vier Fehler bei „nur Gesamtchart #1“

(1) IDE folgt falschem Chart: Cursor-Default = Gesamt #1, Coding-Traffic liegt im Programming-Slice — Qualität und Kosten leiden. (2) Collections vs. Leaderboard vermischt: Collections kuratiert Szenarien; Hauptchart misst Gesamt-Tokens. Hy3 preview top in Programming, oft außerhalb Top-10 gesamt. (3) Provider-Schicht ignoriert: SiliconFlow-Relay ~4T+ Tokens/Woche, Umsatzanteil <2 % (Dual-Ranking-Artikel) — nur model id ändern reicht nicht. (4) Kein wöchentlicher Diff: Juni-Updates schneller als Release-Zyklen; fest codierte openclaw.json → Rechnungssprung nach Preview-Ende (Trending-Artikel = Zeitachse; hier = Seiten-Gesamtabgleich).

2. Zehn Ranking-Dimensionen: Messgröße und Mac-Nutzen

Dimension (rankings)	Metrik	Mac-Einsatz
Top Models / LLM Leaderboard	Wochen-Tokens gesamt	OpenClaw-Default, General-Agent
Market Share	Anteil nach Autor	Konzentration, Compliance, DSGVO
Languages	Natürliche Sprache	DE/EN/ZH getrennte Defaults
Programming	Programmiersprache (z. B. Python)	Cursor / Cline / Continue
Context Length	Prompt-Längen-Bucket	Long-RAG-Routing
Tool Calls	Tool-Call-Volumen	OpenClaw / Hermes-Stack
Images / Image Output	Multimodal in/out	Visual Agent vs. ComfyUI
Audio Input	Sprach-Input-Tokens	Podcast/Meeting-STT
Trending	WoW-Zuwachs	Graustufen-Pool (kein Prod-Default)
Programming Collections	Szenario-Kuration + Juni-Volumen	IDE-Primärreferenz

3. Plattform-Skala Anfang Juni: 31T/Woche und 60 % China — datenbasiert lesen

Drittanbieter-Snapshot (Ende Mai–Anfang Juni 2026): ~31,34T Tokens/Woche. Offizielle Series-B-Angabe: ~25T/Woche. Delta = Fenster und Vollrouting-Inklusion. Für Betrieb reichen relative Ränge und WoW-Deltas. Chinesische Anbieter aggregiert 60 %+ Token-Anteil — kein globaler API-Marktanteil, sondern Kosten-Nutzen-Wahl via OpenRouter. Mac-Übersetzung: Default-Spur = günstige Open-Source/Preview-Linien; Dollar-Spur = Claude Opus / GPT-5.5 für schwere Tasks. EU: bei Datenverarbeitung außerhalb EWR AVV und TOMs des gewählten Providers prüfen; Steady-State-Modelle (MiMo, V4 Pro) oft stabiler als reine Preview-Spikes.

4. Programming Collections vs. Top Models: Juni-Versatz

OpenRouter aktualisierte im Juni 2026 die Programming-Collection: Ranking nach realem Coding-Traffic über OpenRouter. Öffentlich sichtbare Spitzengruppe:

DeepSeek V4 Flash: MoE 284B/13B aktiv, 1M Context, Durchsatz-Coding;
Tencent Hy3 preview: Programming-Collection oben, IDE-Graustufen;
MiMo-V2.5-Pro / DeepSeek V4 Pro: Gesamt- und Programming-Chart parallel;
Claude Opus/Sonnet 4.6–4.7: nicht immer #1 Volumen, Dollar-Spur für Refactoring.

Versatz-Regel: Top Models #1 ≠ Programming #1 → Cursor folgt Programming + Collections; OpenClaw bleibt bei Top Models + Tool Calls. Ein Gesamtchart-Artikel darf IDE- und Agent-Configs nicht vereinen.

5. Sechs Schritte wöchentliches Update (Montag, 30 Min.)

Schritt 1 — Zehn-Dimensionen-One-Pager screenshotten

Top Models Top-5, Programming Top-5, Tool Calls Top-3, Market Share China-Anteil notieren.

Schritt 2 — Collections abgleichen

Programming-Collection öffnen; Modelle mit >5 Plätzen Abstand zum Hauptchart markieren (z. B. Hy3 preview).

Schritt 3 — Cursor-Routing anpassen

Coding-Default → Programming #1–#2; schwere Bugs → Dollar-Spur Sonnet/Opus.

Schritt 4 — OpenClaw-Fallback

Primär = Top Models; Tool-Calls-Top-3 in Fallback; Collections-Neuheiten nur am Ende als Graustufen (≤10 %).

Schritt 5 — Provider und Preview-Kalender

provider slug fixieren; Gratis-Preview-Enddatum setzen; am Tag openclaw doctor ausführen.

Schritt 6 — Mac-Dreispur-Abnahme

Steady-State → lokales MLX-Quant; Experimente → Remote-Mac-Vergleich; schwere Tasks → API Dollar-Spur.

Montags-Diff-Vorlage (Confluence/Notion)
├─ Wochen-Tokens gesamt: ___T (WoW ___%)
├─ Top Models #1–3: ___
├─ Programming #1–3: ___ (Abstand Gesamt: ja/nein)
├─ Tool Calls #1–2: ___
├─ China Market Share: ___%
└─ Graustufen diese Woche (≤10%): ___
                

6. Dreispur-Entscheidungsmatrix

Task	Chart folgen	Mac-Pfad
Cursor-Tages-Completion	Programming + Collections	Lokales MLX-Kleinmodell oder OpenRouter-Budget
OpenClaw 7×24	Top Models + Tool Calls	Remote-Mac-Gateway dauerhaft
Long-RAG	Context Length >32K	Lokal 64 GB+ oder Remote MLX
Bild-Assets	Image Output	ComfyUI lokal + API-Fallback
Architektur/Sicherheit	kein Token-Chart	Dollar-Spur Claude/GPT

7. Fallstudie: Gesamt #1 in Cursor → Coding-Kosten +38 %

„Sechsköpfiges Mac-Team setzte MiMo-V2.5-Pro (Top Models #1) als einheitlichen Cursor- und OpenClaw-Default. Nach zwei Wochen: 71 % Coding-Tokens, P95-Latenz SWE-Tasks +22 %. Abgleich Programming-Chart: IDE sollte DeepSeek V4 Flash folgen. Split: Cursor → V4 Flash + Hy3 8 % Graustufen; OpenClaw → MiMo primär + Tool-Calls-Hermes. Monatskosten $3.400 → $2.108 (−38 %), P95 −19 %.“

Gesamtchart = „global heißeste“; Collections/Programming = „szenario-optimal“. Ergänzt Trending- und Dual-Ranking-Artikel ohne Duplikate.

8. Brancheneinblick: Rankings werden zum wöchentlichen Routing-PR

Bei ~31T/Woche ist Modell-Takt schneller als klassische Releases. Rankings + Collections = öffentliche Telemetrie eines Multi-Tenant-Routers. Mac-Vorteil: Apple Silicon für MLX-Steady-State-Vergleich, Remote Mac für Collections-Regression — Unified Memory bleibt frei. Windows/Linux nutzen OpenRouter ebenfalls; für launchd-Gateway, parallele Xcode/FCP/ComfyUI-Workloads, Metal-Sidecar bleibt macOS oft stabiler. Physische Trennung Gesamt-Steady-State vs. Programming-Experimente: MACGPU Remote-Mac-Knoten für OpenClaw und IDE-Graustufen, Laptop nur Review + Dollar-Spur — weniger Ausfallrisiko in Produktion.

9. Zitierbare Zahlen und Abnahme-Checkliste

① Wochen-Tokens (Drittanbieter): ~31,34T; offiziell ~25T. ② China-Token-Anteil: 60 %+. ③ Programming-Spitze (Juni): DeepSeek V4 Flash, Hy3 preview. ④ Nach Split: $3.400 → $2.108 (−38 %).

Frage: Widerspruch zu Trending? Nein — Trending = „diese Woche testen?“; hier = „welches Feld auf der Seite?“ Frage: Programming-Slice separat? Ja, plus Collections-Juni-Update abgleichen.