2026 OPENROUTER
IMAGE_
OUTPUT_
LANGUAGES_
MAC.
Auf openrouter.ai/rankings verarbeitet die Plattform nach Series B (26.05.) rund 25T Tokens/Woche. Gesamtchart, Programming, Tool Calls und Images-Eingabe (drei Charts) decken Text, Agenten und Multimodal-Verstehen ab — Image Output (Generierung) und Languages fehlten als Abschluss. Ende Mai dominieren im Image-Output-Chart Flux.2 Pro, xAI Grok Imagine und Recraft V4.1; im Market Share liegen chinesische Anbieter bei >60 % der Wochen-Tokens, während Languages standardmäßig English anzeigt. Dieser datengetriebene Leitfaden liefert: Slice-Definitionen, Image-Output-Snapshot, Languages-vs-Market-Share, Anbieterwoche, sechs Schritte, Drei-Spur-Matrix, Fallstudie, Referenzzahlen und Abnahme-Checkliste.
1. Problemdefinition: Gesamt- und Images-Eingabe-Charts wählen keine Bildgeneratoren
(1) Dimensionsfehler: Gesamt-#1 MiMo-V2-Pro misst Text-Token-Volumen, nicht „Poster pro Woche“. Der 0528-Images-Slice erfasst Bildverständnis (Screenshot-QA, OCR); Image Output zählt Modelle mit output_modalities inkl. image, oft $/Bild (Grok Imagine ab ~$0,05/Bild). (2) Languages-Falle: Default English suggeriert „Englisch-Chart = bestes Modell für meine Nutzer“ — Market Share zeigt Xiaomi, Alibaba, MiniMax dominant. (3) Abrechnungssplit: ComfyUI lokal („nur Strom“) plus ungeprüfte OpenRouter-Bild-APIs → Monatskostenexplosion. (4) Unified Memory: ComfyUI Flux + API-Batch auf M3 36GB → häufig OOM/Swap. (5) Release-Woche: Step 3.7 Flash, Claude Opus 4.8 Fast trenden, verdrängen Flux/Grok im Image Output nicht.
Für DSGVO-sensible Teams in der EU: Bildgenerierung über US-Anbieter (xAI, Google) erfordert dokumentierte Verarbeitungszwecke; Market Share dient der Fallback-Reihenfolge, nicht der Rechtsbewertung. Messbare KPI: $/Bild p50/p95, OOM-Rate, TTFT API vs. lokale ComfyUI-Pipeline.
(6) Release-Rauschen vs. Produktionsrouting: Step 3.7 Flash und Claude Opus 4.8 Fast erscheinen in Trending und Community-Feeds, verschieben aber nicht die strukturelle Spitze von Image Output. Wer wöchentlich nur „was ist neu“ verfolgt, verpasst die stabile Dreiergruppe Flux / Grok / Recraft. (7) IDE-Defaults: Cursor, Cline und Agent-Frameworks wählen weiterhin Text-#1 aus dem Gesamtchart — für Poster, Thumbnails und E-Commerce-Kataloge braucht es einen separaten Policy-Block mit modalities und $/Bild-Caps. (8) Audit-Pflicht: ComfyUI lokal liefert reproduzierbare Seeds und Workflow-JSON; reine API-Generierung ohne Export erschwert Marken-Freigaben — hybride Architektur (API tags, ComfyUI nachts) ist für Agenturen die normative Lösung.
2. Messgrößen: Image Output × Languages × Market Share (KW 2026-05-29)
| Slice | Metrik | Typische Fehllesung | Mac-Nutzung |
|---|---|---|---|
| Image Output | Generiertes Bildvolumen | identisch mit Images-Eingabe | Poster, E-Commerce, Thumbnails |
| Languages | Prompt-Sprachverteilung | „stärkstes Modell pro Sprache“ | UI-Locale vs. Modellhersteller trennen |
| Market Share | Token-Anteil nach Autor | Compliance-Urteil | Kosten, Fallback-Vendor |
| Images (Eingabe) | Verstehens-Traffic | für Generierung nutzbar | siehe Post 28.05. |
| Top Models | Gesamt-Wochen-Tokens | Universal-Default | reiner Text (Post 25.05.) |
Wöchentlicher Ops-Run: Image Output + Market Share gemeinsam exportieren; bei zweisprachigen Produkten English-Languages-Slice mit Ist-Locales abgleichen. OpenRouter-Doku: modalities: ["image"] oder ["image","text"]; Models-API-Filter architecture.output_modalities.
Datenquellen-Trennung für Reporting: (A) Plattform-Traffic aus Rankings-Slices — relativ, wöchentlich vergleichbar; (B) eigene Rechnung aus OpenRouter Dashboard — absolut in USD; (C) lokale ComfyUI-Kosten — Strom + Amortisation Hardware. Nur (B)+(C) in CFO-Slides mischen, wenn (A) als Routing-Begründung dokumentiert ist. Für Mac-Teams empfiehlt sich ein Spreadsheet mit Spalten: Modell-ID, Slice-Rang, $/Bild Ist, Latenz p95, OOM Ja/Nein, Sprach-Sonde EN/DE Gewinnrate.
3. Image-Output-Snapshot (Referenzwoche 29.05.2026)
| Tier | Modell-ID (Beispiel) | Use Case | Mac-Pfad | Preisindikator |
|---|---|---|---|---|
| T1 | black-forest-labs/flux.2-pro, flux.2-max | Produktfoto, Brand-KV | API; ComfyUI A/B | $/Bild, Flex-Tarif |
| T2 | x-ai/grok-imagine-image-quality | Mehrsprachiger Text im Bild | API; Tages-Cap | ~$0,05/Bild |
| T3 | recraft/* V4.1 | SVG, Verläufe | API | pro Bild |
| T4 | google/gemini-3.1-flash-image-preview | Text+Bild eine Anfrage | API | gemischt |
| T5 | ComfyUI + Flux/SDXL | Nacht-Batch, auditierbar | lokal / Remote 128GB | Strom + Amortisation |
Überlappung Image Output ↔ Images-Eingabe typisch <35 % (wöchentlich validieren). Budget-Trennung empfohlen: Sub-Key „Review-Agent“ (Gemini Flash, 0528) vs. „Asset-Gen“ (Flux.2 / Grok). Flux.2 Pro: 4MP-Editing, Konsistenz; Grok Imagine: 1K/2K, Text im Bild mehrsprachig.
Technische Abnahme pro Tier: T1 Flux — Kantenschärfe und Hautton auf Mac-Display kalibriert messen; T2 Grok — OCR-ähnliche Lesbarkeit deutscher Umlaute in 1024²; T3 Recraft — SVG-Export in Figma ohne Pfad-Bruch; T4 Gemini image preview — Latenz bei gemischtem Text+Bild-Request; T5 ComfyUI — VRAM-Kurve über 20 sequentielle Jobs (Activity Monitor). Wer nur einen Tier testet, unterschätzt Hybridkosten: viele Teams landen bei 60 % API (Iteration) und 40 % lokal (Nacht-Batch) nach vier Wochen Daten — nicht 0/100 aus Bauchgefühl.
4. Languages: English-UI vs. chinesisch dominierter Market Share
Öffentliche Aggregate Ende Mai 2026: sechs chinesische Anbieter zusammen ~59,6–60 %+ Wochen-Tokens; MiMo-V2-Pro allein ~21,1 % vs. OpenAI ~7,5 % (Drittquellen). Konsequenz für Metriken: viele englische Prompts routen auf chinesische Basismodelle (Kosten). Mac-Abnahme: 50 EN + 50 DE/ZH Poster-Prompts pro Kandidat; erfassen Lesbarkeit eingebetteter Schrift, kulturelle Entitäten, Layout. Programming: MiMo+Qwen ~49 % Coding-Tokens — relevant für „englische UI, chinesischer Ops“-Dualrouting.
Languages misst Prompt-Sprache, nicht Modell-Herkunft. Für den DACH-Markt: Deutsch-Prompts separat gegen English-Chart benchmarken; Market Share für Text-Fallback (Qwen, DeepSeek), nicht für Bild-Default.
Praxisbeispiel E-Commerce: UI auf Deutsch, 70 % Prompts technisch auf Englisch (Produkt-SKUs, SEO-Keywords). Der Languages-Slice „English“ überschätzt scheinbar den „englischen Markt“, während Qwen oder MiMo die Inferenz ausführen. Abnahme: gleiche 20 Produkt-Prompts in DE und EN an Flux.2 Pro und Grok Imagine — Diff der eingebetteten Schrift und der Farbabweichung (ΔE in ColorSync-Vorschau) protokollieren. Programming-Korrelation: Teams mit hohem MiMo+Qwen-Anteil im Coding-Chart sollten nicht automatisch dieselben IDs für Bilder wählen — separate Policy-Datei image-routing.yaml versionieren.
5. Market Share: Anbieterwoche und Mac-Vendor-Strategie
| Anbieter | Flaggschiff | ~Anteil | Mac-Hinweis |
|---|---|---|---|
| Xiaomi | MiMo-V2-Pro | ~21,1 % | Text-Default; Bild: Flux/Grok |
| Alibaba | Qwen 3.6 / 3.7 Max | ~13,9 %+ | Langkontext, zweisprachige Agenten |
| MiniMax | MiniMax M2.7 | ~8,1 % | hoher Text-Durchsatz |
| OpenAI | GPT-5.5 | ~7,5 % | Compliance-Fallback EU/US |
| Anthropic | Claude Opus/Sonnet 4.8 | trend ↓ | Schwere Textaufgaben, kein Bild-Default |
Analysierte Woche 27.04.–03.05.: CN-Modelle 7,942T (+81,7 % WoW), US-Modelle -34,6 %. Market Share = Fallback-Reihenfolge bei Rate-Limit; Image Output Top-3 bei Generierung fixieren — MiMo nicht für Bildausgabe erzwingen.
Szenario Rate-Limit: MiMo #1 im Text fällt auf Qwen3.7 Max, während Image Output unverändert flux.2-pro bleibt — zwei unabhängige State-Machines in Ihrer routing.yaml. Szenario Preiserhöhung Grok: Fallback recraft oder gemini-3.1-flash-image-preview nur nach erneuter 20-Bild-Sonde, nicht blind. Für Mac-FinOps: monatliche Pivot-Tabelle Anbieter × Modalität (text/image) × Kosten — verhindert, dass 60 %+ CN-Token im Text die Wahrnehmung „wir sind bereits China-first für alles“ erzeugen, während Bilder teuer bei BFL/xAI bleiben.
6. Sechs Schritte: drei Slices → Mac-Bild-Routing
Schritt 1 — Wöchentlich Image Output + Market Share ziehen
openrouter.ai/rankings; Languages mindestens English plus Produkt-Locales (DE/EN/ZH). Screenshot mit Datum im Dateinamen archivieren; bei Series-B-News (25T/Woche) nicht die Slice-Filter vergessen — ohne Filter „Image Output“ landen Sie erneut im Gesamtchart.
Ergänzend: OpenRouter-Dashboard nach Modell-ID filtern und wöchentliche Top-5 nach $ sortieren — Abweichung >15 % gegenüber Vorwoche triggert Re-Run der Sechs-Schritte-Sonde, auch wenn der öffentliche Chart unverändert wirkt (Preisänderungen sind unsichtbar im Ranking).
Schritt 2 — Models API: output_modalities image
Pricing exportieren ($/Bild vs. Token); JSON versionieren unter /tmp/or-image-out-YYYYMMDD.json.
Schritt 3 — Verstehen vs. Generieren budgetieren
Images-Eingabe → Gemini Flash (0528); Image Output → Flux.2 / Grok — getrennte Sub-Keys.
Schritt 4 — ComfyUI vs. API A/B
Identischer Prompt, je 20 Bilder: Latenz, $/Bild, Textgenauigkeit im Bild.
Schritt 5 — Zweisprachige Poster-Sonde
30 EN + 30 DE (oder ZH): Grok (Schrift) vs. Flux (Ästhetik) — Gewinnrate dokumentieren. Ergebnis als CSV mit Spalten Modell, Sprache, Lesbarkeit 1–5, $/Bild, p95 Latenz — Grundlage für das wöchentliche Routing-Review mit Finance und Creative Lead.
Schritt 6 — Nacht-Queue >200 Bilder → Remote Mac
MACGPU-Node; tags nur Workflow-Iteration auf dem Laptop. launchd-Plist mit Startfenster 22:00–06:00, Fehler-Webhook bei >2 % Failed Jobs; geteiltes SMB-Volume für Freigabe an Keynote/Final Cut am Morgen.
Governance zwischen den Schritten: (i) wöchentliches Diff der Models-API-Preise vs. Budget; (ii) Alarm bei $/Tag >120 % des 4-Wochen-Schnitts; (iii) quartalsweise Re-Validierung der <35 %-Overlap-Annahme zwischen Image Output und Images-Eingabe. Ohne diese drei Kontrollpunkte driftet selbst ein einmal korrektes Routing innerhalb von zwei Release-Zyklen (neue Gemini-Image-Preview, Recraft-Minor) zurück in Teuer-Defaults.
7. Drei-Spur-Matrix: ComfyUI / OpenRouter API / Remote Mac
| Szenario | Spur | Konfiguration | Abnahme (messbar) |
|---|---|---|---|
| Einzel-Poster-Iteration | API | Grok Imagine / Flux.2 Flex | <25s, <$0,08/Bild |
| Marken-Asset-Bibliothek | ComfyUI lokal | Flux.1 + Metal | 20 Bilder ohne OOM |
| 500+ Bilder/Nacht | Remote-Queue | ComfyUI headless | <2 % Fehler in 8h |
| DE/EN Text im Bild | API | Grok Imagine Quality | Lesbarkeit >90 % |
| Review-Agent parallel | API Dual-Bucket | Gemini Images + Flux Out | Rechnungen trennbar |
| Compliance EU Kunde | API + Audit-Log | Flux API + ComfyUI Seeds | Herkunft pro Asset |
| A/B Markenkampagne | Hybrid | 10 API + 10 ComfyUI | ΔE <3 vs. Referenz |
Die Matrix ist bewusst betriebsnah: Spalte „Abnahme“ verhindert Diskussionen ohne Zahl. Wer „Einzel-Poster“ auf API Grok legt, aber p95 >25s sieht, wechselt zuerst Region/Modell-Variante, nicht blind zu lokalem Flux — andernfalls steigt Engineering-Zeit ohne $/Bild-Gewinn. Remote-Mac-Spur (MACGPU M4 Max 128GB) lohnt sich, sobald Nacht-Batch >3h oder Swap >10GB beobachtet wird — messbar im Activity Monitor über „Memory Pressure“ und „Swap Used“.
8. Fallstudie: Cross-Border-DTC, Bildkosten −41 %
„6-köpfiges DTC-Team, Mac Studio M2 Ultra 64GB: alle Poster über Claude-Multimodal-Dialog ($4.100/Monat OpenRouter). Nach Image-Output-Chart: Generierung → Flux.2 Pro + Grok Imagine ($/Bild), Claude nur Copy; Languages-Sonde: 40 % Prompts faktisch DE/ZH → Qwen für Text, Grok für Bild; 800 Bilder/Woche → MACGPU M4 Max ComfyUI Nacht-Queue. 30 Tage: $2.420 (−41 %); tags kein ComfyUI∥Claude-Swap.“
Kernmetrik: Hauptkostentreiber = Dialogmodell für Bilder + fehlender Split Images-Eingabe / Image Output. Market Share 60 %+ CN = Text/Ops, nicht Bild-Default.
Detailierte Vorher/Nachher-Tabelle (Fall): Vorher — 100 % Bilder via Claude Sonnet/Opus Multimodal, ~$0,12–0,18 effective $/Bild inkl. Text-Tokens; Nachher — Flux.2 Pro ~$0,06–0,08, Grok Poster ~$0,05, Claude nur Copy ~$400/Monat Text. ComfyUI-Nacht: 800 Bilder/Woche à ~$0,01 amortisierte Hardware-Kosten vs. $0,05+ API. Sprach-Sonde: 40 % Prompts DE/ZH → Qwen für Prompt-Rewrite reduzierte Grok-Retries um 18 %. Technisch: unified memory tags frei für Figma/Keynote, kein Swap-Spike 14–17 Uhr. Lessons learned: Rankings lesen als zwei Achsen (Vendor vs. Modalität), nicht als eine „Best Model“-Liste.
9. Prognose: Bild-Chart und Anbieter-Chart divergieren dauerhaft
Bei ~25T Tokens/Woche: Text-Ostverschiebung, Image Output West-Spezialisten (BFL, xAI, Google, Recraft). H2 2026: IDE/Agenten setzen modalities: ["image"] standardmäßig; Languages granularer (DE, ES, JP). Apple Silicon: ColorSync, Final Cut-Handoff, launchd-Nachtqueues — Windows/Linux-Cloud-GPU ohne diese Pipeline.
64GB reicht nicht für Tag-Bearbeitung + 500 API-Bilder: Remote Apple Silicon (MACGPU M4 Max 128GB, ComfyUI Flux + OpenRouter-Skript-Queue); Laptop nur Review-Agent und Prompt-Iteration — gleiche Routing-Tabelle, getrennte Lastspitzen.
Vergleich Windows/Linux-Cloud-GPU: CUDA-Cluster liefern rohen Durchsatz, fehlen aber an der nahtlosen P3/Display-P3-Vorschau und an stabiler Metal-ComfyUI-Nachtlast ohne Treiber-Neustart-Pflicht. Für europäische Agenturen mit DSGVO-Anforderungen bleibt dokumentierbarer Workflow (lokale Seeds + API-Stichproben) auf Mac oft schneller freigabefähig als reine US-Cloud-Batch-Jobs ohne Asset-Herkunft. Die Divergenz „Text-Ost / Bild-West“ wird 2026 H2 weiter zunehmen, sobald Agenten standardmäßig Bilder erzeugen — frühe Trennung der Budget-Buckets ist günstiger als nachträgliche Rechnungs-Aufteilung.
10. Referenzzahlen, FAQ & Abnahme
① ~25T Tokens/Woche (26.05.). ② CN-Anbieter >60 %. ③ MiMo ~21,1 %. ④ Grok Imagine ~$0,05/Bild. ⑤ Fall $4.100→$2.420 (−41 %). ⑥ Overlap Image Output / Images-Eingabe <35 % (wöchentlich messen). ⑦ Programming MiMo+Qwen ~49 % Coding-Tokens. ⑧ WoW CN +81,7 % / US −34,6 % (Analysewoche Apr 27–Mai 3). ⑨ ComfyUI-Durchsatz M4 Max 128GB typisch 40–60 Bilder/h Flux-Workflow. ⑩ Ziel p95 API-Einzelposter <25s bei <$0,08/Bild.
Verknüpfung zur MACGPU-Serie: Post 0525 liefert Gesamt-Entscheidungsmatrix; 0526 Programming für IDE; 0527 Tool Calls für Agenten; 0528 Images/Context/Audio für Verstehen — dieser Post 114 schließt Generierung + Sprach-Slice + Anbieteranteil. In der Praxis reicht ein gemeinsames Notion- oder Confluence-Board mit wöchentlichen Screenshots der drei Slices plus Ihrer Ist-Rechnung — so bleibt die Routing-Policy für das ganze Team nachvollziehbar, wenn Modelle wöchentlich rotieren. Bei Abweichung >20 % zwischen Chart-Rang und Ihrem $/Bild-Ist: zuerst Pricing-JSON diffen, dann Sonde wiederholen — nicht sofort den Anbieter wechseln.
0528 Images-Charts noch nötig? Ja — Verstehen bleibt dort. Nur English Languages? Nein — Market Share + Ist-Locale. Flux lokal ersetzen? ComfyUI approximiert; API-Stichprobe für Flagship-Ästhetik. Warum zwei OpenRouter-Keys? Damit Dashboard und Alerts getrennt „Review“ vs. „Generate“ melden. Remote Mac Pflicht? Ab ~200 Bildern/Nacht oder 36GB OOM — dann ja. Recraft vs. Flux? Recraft für SVG/Vektor-Look; Flux für fotorealistische Packshots.
Abnahme-Checkliste (ausdruckbar): (1) Zwei Budget-Buckets mit Hard-Cap aktiv. (2) Models-JSON wöchentlich archiviert. (3) A/B 20 Bilder pro Pfad mit $/Bild und p95-Latenz. (4) EN+DE Sonde ≥60 Prompts dokumentiert. (5) Nacht-Queue 8h-Lauf <2 % Fail. (6) Kein paralleler Claude-„Bilddialog“ in Produktion. (7) DSGVO-Notiz zu US-Bildanbietern. (8) POST-114 Routing-Tabelle im Team-Wiki verlinkt zu 0525–0528-Serie.