2026 OPENROUTER
TRENDING_
VS_
TOP_
MODELS.
Auf openrouter.ai/rankings beantwortet This Week (Top Models) datenbasiert, wer diese Woche die meisten Tokens verbraucht; Trending misst den stärksten WoW-Anstieg — oft sind das verschiedene Modellfamilien. Die Mai-Serie deckte Gesamtchart, Programming, Tool Calls und weitere Slices ab; der Dual-Ranking-Leitfaden Anfang Juni trennt Token-Volumen von Umsatz. Dieser datengetriebene Artikel ergänzt die Zeitachse: öffentlich ~25T Tokens/Woche (Series B), Snapshots ~31,34T, Gemini 3.1 Flash Lite +15 % WoW vs. Steady-State-Giganten wie MiMo-V2.5 — und wie Sie das auf Mac-Cursor / OpenClaw aufteilen. Fazit: Produktions-Defaults = Top Models + passender Slice; Trending nur Graustufen-Pool mit Preview-Ende-Runbook. Inhalt: Acht-Chart-Baum — drei Modelltypen — sechs Schritte — Matrix — Fallstudie — Abnahme-Checkliste.
1. Pain Points: fünf typische Trending-Fehler
(1) +15 % WoW als „global besser“ lesen: Flash/Lite-Spikes kommen häufig von Preissenkungen, Gratis-Previews oder Agent-Fluten, nicht von SWE-bench-Spitzenwerten. (2) Nur Top Models #1 beobachten: MiMo-V2.5 eignet sich als Agent-Default; Qwen 3.6 Plus Preview kann nach Billing-Start halbierte Traffic zeigen. (3) Acht Charts isoliert interpretieren: Programming-#1 und Images-#1 in einer Fallback-Kette degradieren Multimodal-Tasks still. (4) Kein Routing-Update nach Preview-Ende: OpenClaw behält alte model ids — Rechnung ×2 über Nacht. (5) Produktionswechsel ohne Mac-Abnahme: ob ein Trending-Modell auf 36 GB Unified Memory per MLX läuft, entscheidet, ob Spike-Traffic zurück auf den Mac kann. Für EU-Teams: Provider mit klarer DSGVO-/Auftragsverarbeitungs-Dokumentation separat bewerten, wenn Trending-Modelle neue Regionen oder Subprozessoren einführen.
2. Acht Ranking-Dimensionen: Messgröße und Mac-Nutzen
| Dimension | Datenfeld | Mac-Routing |
|---|---|---|
| Top Models | Kumulierte Wochen-Tokens | Produktions-Default, OpenClaw-Primär |
| Trending | Größter WoW-Zuwachs | Graustufen, A/B, zeitlich begrenzter Fallback |
| Market Share | Anteil nach Anbieter | Konzentration, Compliance, Verhandlung |
| Languages | Nach Sprache | Getrennte Defaults DE/EN/ZH |
| Programming | Nach Sprache (z. B. Python) | Cursor / Cline |
| Context Length | Prompt-Längen-Bucket | Long-RAG vs. Kurzchat |
| Tool Calls | Tool-Call-Volumen | Agent / OpenClaw |
| Images / Image Output / Audio | Multimodal | Vision-Agent, ComfyUI vs. API |
Verknüpfungsregel (datenbasiert): Workload-Typ fixieren → passenden Slice öffnen; Trending nur hochstufen, wenn dasselbe Modell im Ziel-Slice ebenfalls Top 10 ist.
3. Plattformskala Anfang Juni: 25T–31,34T/Woche
Series-B-Materialien nennen ~25T Tokens/Woche (~5× vs. ~5T vor sechs Monaten); öffentliche Endpoint-Snapshots Ende Mai ~31,34T/Woche. Konsequenzen: (1) Agent-Defaults wöchentlich prüfen; (2) chinesische Open-Source-Modelle weiterhin oft 60 %+ Token-Anteil — günstig, aber Datenresidenz und DSGVO-Risiko separat dokumentieren; (3) WoW +12 % bis +432 % ist Routine — ein „Spike-Diff“-Skript schlägt manuelles Chart-Refresh.
4. Drei Modelltypen: Spiker, Stable, Declining
| Typ | Signal | Beispiele (öffentl.) | Mac-Strategie |
|---|---|---|---|
| Spiker | Trending vorn, WoW zweistellig+ | Gemini 3.1 Flash Lite (+15 %), Qwen 3.6 Plus Preview (neu Top 5) | 5–10 % Graustufen; Kalender Preview-Ende |
| Stable | Top Models #1–#3 dauerhaft | MiMo-V2-Pro/V2.5, DeepSeek V4, MiniMax M2.7 | Produktion + MLX-Größencheck |
| Declining | Anteil in Top 10 sinkt | Teile GPT-5.x (~-8 % relativer Anteil) | Dollar-Spur-Fallback, kein Agent-Default |
5. Acht-Chart-Entscheidungsbaum (kompakt)
6. Sechs Schritte: Charts → openclaw.json / Cursor
Schritt 1 — Montags-Snapshot
Top Models Top 5 + Trending Top 5 exportieren, WoW % markieren.
Schritt 2 — Slice = Workload
Code → Programming; Agent → Tool Calls; Gesamtchart nie als Ersatz.
Schritt 3 — Trending in Graustufen
Am Ende der Fallback-Liste; max. 10 % Sessions.
Schritt 4 — Preview-Ende-Runbook
Kalender; am Preisänderungstag model id + openclaw doctor.
Schritt 5 — Mac-Dreispur
Stable per MLX lokal tagsüber; Spiker zuerst Remote-Mac-Abnahme; schwere Tasks Dollar-Spur.
Schritt 6 — Wochenreview
$/1M, P95, Preview-Status; Declining aus Default-Kette.
7. Drei-Stufen-Matrix
| Szenario | Top Models | Trending | Pfad |
|---|---|---|---|
| Cursor Completion | ✅ Stable günstig | ❌ kein Default | Lokal MLX / OpenRouter |
| OpenClaw 7×24 | ✅ Primär | ⚠️ nur Fallback-Ende | Remote Mac Gateway |
| Modell-Trial | ❌ | ✅ Graustufen | Remote Mac Sandbox |
| Gratis-Preview | ❌ kein Dauer-Default | ✅ zeitlich begrenzt | Migration bei Preview-Ende |
8. Fallstudie: Trending-Jagd → Stable + Graustufen
„Achtköpfiges Mac-Team setzte Qwen 3.6 Plus Preview (Trending #2) als OpenClaw-Default. Zwei Wochen Gratis-Preview: 9,2B Tokens/Monat. Nach Paid-Pricing ohne Config-Änderung: $1.100 → $4.600/Monat. Post-Mortem: Coding hätte Programming-Chart DeepSeek V4 Flash folgen müssen; Preview nur 10 % Graustufen. Zurück auf MiMo-V2.5 + Preview-Graustufen + Auto-Downgrade am Billing-Tag — Folgemonat $2.050, -55 %, Trending weiter A/B im Graustufen-Pool.“
Trending liefert Signale, kein Produktions-Default. Orthogonal zum Dual-Ranking: Geld vs. Zeit.
9. Markt: Charts beschleunigen; Mac als Kontrolllabor
Bei 25T+ Tokens/Woche sind Modellzyklen kürzer als klassische Releases. Stealth-Launches und Gratis-Preview-Spikes werden Normalfall. Mac-Wert: MLX/Ollama-Baseline für Stable; Trending-Kandidaten per Agent-Regression auf Remote Mac, Laptop-Cursor auf Stable — 36 GB bleiben frei. Unter macOS sind launchd-Gateway, parallele Xcode/FCP-Pipelines, Metal-Sidecar pragmatischer als reine Linux-VMs. MACGPU Remote-Mac-Knoten isolieren Trending-Graustufen physisch; Laptop nur Review und Dollar-Fallback.
10. Zitierbare Kennzahlen und Abnahme
(1) Wochen-Tokens: ~25T (Series B), Snapshot ~31,34T. (2) Chinesische Modelle: 60 %+ Token-Anteil. (3) Spikes: Gemini 3.1 Flash Lite +15 % WoW; Qwen 3.6 Plus neu Top 5. (4) Preview→Paid: $4.600 → $2.050 (-55 %).
Abnahme-Checkliste: Top Models Top 5 protokolliert □ | Trending Top 5 □ | Slice = Workload □ | Trending ≤10 % Graustufen □ | Preview-Ende-Kalender □ | Fallback-Ende entfernbar □ | Remote Mac 50 Prompts □ | DSGVO/AVV Provider geprüft □
F: Trending + Dual-Ranking? Dual = Volumen vs. Geld; Trending = Trial diese Woche. F: Programming für IDE? Ja, verpflichtend. F: MACGPU? Remote Mac für Graustufen/Agent; Laptop MLX-Baseline und teurer Fallback.