2026 OPENROUTER
TEN_DIM_
WEEKLY_
SNAPSHOT.
Auf openrouter.ai/rankings ändern viele Teams den Cursor-Default nach Top Models #1 — die Juni-2026-Telemetrie ist jedoch längst slice-spezifisch: Gesamtchart #1 oft MiMo-V2.5-Pro, während Programming Collections (Update Juni 2026) von DeepSeek V4 Flash und Tencent Hy3 preview angeführt werden. Gemessene Plattform-Wochenlast: 25T–31,34T Tokens; chinesische Anbieter (Xiaomi, Alibaba, DeepSeek u. a.) aggregiert 60 %+ Volumen. Dieser datengetriebene Leitfaden liefert den vollständigen Zehn-Dimensionen-Wochen-Snapshot für Mac-Teams: wann Top Models, wann Collections/Slices, wie OpenClaw/Cursor wöchentlich aktualisieren. Fazit: Rankings als Routing-Konfigurationstabelle — pro Task-Typ die passende Dimension; Gesamtchart-#1 darf Programming- und Agent-Ketten nicht überschreiben. Inhalt: Pain Points — Zehn-Dimensionen-Übersicht — Juni-Versatz — sechs Schritte — Matrix — Fallstudie — Abnahme. Für EU-Teams: Anbieter-Konzentration und DSGVO-/AVV-Dokumentation bei chinesischen Modellen separat bewerten; Stabilität vor Spike-Jagd.
1. Pain Points: vier Fehler bei „nur Gesamtchart #1“
(1) IDE folgt falschem Chart: Cursor-Default = Gesamt #1, Coding-Traffic liegt im Programming-Slice — Qualität und Kosten leiden. (2) Collections vs. Leaderboard vermischt: Collections kuratiert Szenarien; Hauptchart misst Gesamt-Tokens. Hy3 preview top in Programming, oft außerhalb Top-10 gesamt. (3) Provider-Schicht ignoriert: SiliconFlow-Relay ~4T+ Tokens/Woche, Umsatzanteil <2 % (Dual-Ranking-Artikel) — nur model id ändern reicht nicht. (4) Kein wöchentlicher Diff: Juni-Updates schneller als Release-Zyklen; fest codierte openclaw.json → Rechnungssprung nach Preview-Ende (Trending-Artikel = Zeitachse; hier = Seiten-Gesamtabgleich).
2. Zehn Ranking-Dimensionen: Messgröße und Mac-Nutzen
| Dimension (rankings) | Metrik | Mac-Einsatz |
|---|---|---|
| Top Models / LLM Leaderboard | Wochen-Tokens gesamt | OpenClaw-Default, General-Agent |
| Market Share | Anteil nach Autor | Konzentration, Compliance, DSGVO |
| Languages | Natürliche Sprache | DE/EN/ZH getrennte Defaults |
| Programming | Programmiersprache (z. B. Python) | Cursor / Cline / Continue |
| Context Length | Prompt-Längen-Bucket | Long-RAG-Routing |
| Tool Calls | Tool-Call-Volumen | OpenClaw / Hermes-Stack |
| Images / Image Output | Multimodal in/out | Visual Agent vs. ComfyUI |
| Audio Input | Sprach-Input-Tokens | Podcast/Meeting-STT |
| Trending | WoW-Zuwachs | Graustufen-Pool (kein Prod-Default) |
| Programming Collections | Szenario-Kuration + Juni-Volumen | IDE-Primärreferenz |
3. Plattform-Skala Anfang Juni: 31T/Woche und 60 % China — datenbasiert lesen
Drittanbieter-Snapshot (Ende Mai–Anfang Juni 2026): ~31,34T Tokens/Woche. Offizielle Series-B-Angabe: ~25T/Woche. Delta = Fenster und Vollrouting-Inklusion. Für Betrieb reichen relative Ränge und WoW-Deltas. Chinesische Anbieter aggregiert 60 %+ Token-Anteil — kein globaler API-Marktanteil, sondern Kosten-Nutzen-Wahl via OpenRouter. Mac-Übersetzung: Default-Spur = günstige Open-Source/Preview-Linien; Dollar-Spur = Claude Opus / GPT-5.5 für schwere Tasks. EU: bei Datenverarbeitung außerhalb EWR AVV und TOMs des gewählten Providers prüfen; Steady-State-Modelle (MiMo, V4 Pro) oft stabiler als reine Preview-Spikes.
4. Programming Collections vs. Top Models: Juni-Versatz
OpenRouter aktualisierte im Juni 2026 die Programming-Collection: Ranking nach realem Coding-Traffic über OpenRouter. Öffentlich sichtbare Spitzengruppe:
- DeepSeek V4 Flash: MoE 284B/13B aktiv, 1M Context, Durchsatz-Coding;
- Tencent Hy3 preview: Programming-Collection oben, IDE-Graustufen;
- MiMo-V2.5-Pro / DeepSeek V4 Pro: Gesamt- und Programming-Chart parallel;
- Claude Opus/Sonnet 4.6–4.7: nicht immer #1 Volumen, Dollar-Spur für Refactoring.
Versatz-Regel: Top Models #1 ≠ Programming #1 → Cursor folgt Programming + Collections; OpenClaw bleibt bei Top Models + Tool Calls. Ein Gesamtchart-Artikel darf IDE- und Agent-Configs nicht vereinen.
5. Sechs Schritte wöchentliches Update (Montag, 30 Min.)
Schritt 1 — Zehn-Dimensionen-One-Pager screenshotten
Top Models Top-5, Programming Top-5, Tool Calls Top-3, Market Share China-Anteil notieren.
Schritt 2 — Collections abgleichen
Programming-Collection öffnen; Modelle mit >5 Plätzen Abstand zum Hauptchart markieren (z. B. Hy3 preview).
Schritt 3 — Cursor-Routing anpassen
Coding-Default → Programming #1–#2; schwere Bugs → Dollar-Spur Sonnet/Opus.
Schritt 4 — OpenClaw-Fallback
Primär = Top Models; Tool-Calls-Top-3 in Fallback; Collections-Neuheiten nur am Ende als Graustufen (≤10 %).
Schritt 5 — Provider und Preview-Kalender
provider slug fixieren; Gratis-Preview-Enddatum setzen; am Tag openclaw doctor ausführen.
Schritt 6 — Mac-Dreispur-Abnahme
Steady-State → lokales MLX-Quant; Experimente → Remote-Mac-Vergleich; schwere Tasks → API Dollar-Spur.
6. Dreispur-Entscheidungsmatrix
| Task | Chart folgen | Mac-Pfad |
|---|---|---|
| Cursor-Tages-Completion | Programming + Collections | Lokales MLX-Kleinmodell oder OpenRouter-Budget |
| OpenClaw 7×24 | Top Models + Tool Calls | Remote-Mac-Gateway dauerhaft |
| Long-RAG | Context Length >32K | Lokal 64 GB+ oder Remote MLX |
| Bild-Assets | Image Output | ComfyUI lokal + API-Fallback |
| Architektur/Sicherheit | kein Token-Chart | Dollar-Spur Claude/GPT |
7. Fallstudie: Gesamt #1 in Cursor → Coding-Kosten +38 %
„Sechsköpfiges Mac-Team setzte MiMo-V2.5-Pro (Top Models #1) als einheitlichen Cursor- und OpenClaw-Default. Nach zwei Wochen: 71 % Coding-Tokens, P95-Latenz SWE-Tasks +22 %. Abgleich Programming-Chart: IDE sollte DeepSeek V4 Flash folgen. Split: Cursor → V4 Flash + Hy3 8 % Graustufen; OpenClaw → MiMo primär + Tool-Calls-Hermes. Monatskosten $3.400 → $2.108 (−38 %), P95 −19 %.“
Gesamtchart = „global heißeste“; Collections/Programming = „szenario-optimal“. Ergänzt Trending- und Dual-Ranking-Artikel ohne Duplikate.
8. Brancheneinblick: Rankings werden zum wöchentlichen Routing-PR
Bei ~31T/Woche ist Modell-Takt schneller als klassische Releases. Rankings + Collections = öffentliche Telemetrie eines Multi-Tenant-Routers. Mac-Vorteil: Apple Silicon für MLX-Steady-State-Vergleich, Remote Mac für Collections-Regression — Unified Memory bleibt frei. Windows/Linux nutzen OpenRouter ebenfalls; für launchd-Gateway, parallele Xcode/FCP/ComfyUI-Workloads, Metal-Sidecar bleibt macOS oft stabiler. Physische Trennung Gesamt-Steady-State vs. Programming-Experimente: MACGPU Remote-Mac-Knoten für OpenClaw und IDE-Graustufen, Laptop nur Review + Dollar-Spur — weniger Ausfallrisiko in Produktion.
9. Zitierbare Zahlen und Abnahme-Checkliste
① Wochen-Tokens (Drittanbieter): ~31,34T; offiziell ~25T. ② China-Token-Anteil: 60 %+. ③ Programming-Spitze (Juni): DeepSeek V4 Flash, Hy3 preview. ④ Nach Split: $3.400 → $2.108 (−38 %).
Abnahme: Zehn-Dimensionen-Screenshot □ | Programming vs. Top Models Versatz dokumentiert □ | Cursor an Programming angepasst □ | OpenClaw-Fallback Tool Calls □ | Provider slug fix □ | Preview-Ende-Kalender □ | Remote Mac 50 Prompts □
Frage: Widerspruch zu Trending? Nein — Trending = „diese Woche testen?“; hier = „welches Feld auf der Seite?“ Frage: Programming-Slice separat? Ja, plus Collections-Juni-Update abgleichen.