2026 OPENROUTER
IMAGE_
OUTPUT_
LANGUAGES_
MAC.

OpenRouter Bildgenerierungs-Rankings und Apple-Silicon-Mac-Routing

Auf openrouter.ai/rankings verarbeitet die Plattform nach Series B (26.05.) rund 25T Tokens/Woche. Gesamtchart, Programming, Tool Calls und Images-Eingabe (drei Charts) decken Text, Agenten und Multimodal-Verstehen ab — Image Output (Generierung) und Languages fehlten als Abschluss. Ende Mai dominieren im Image-Output-Chart Flux.2 Pro, xAI Grok Imagine und Recraft V4.1; im Market Share liegen chinesische Anbieter bei >60 % der Wochen-Tokens, während Languages standardmäßig English anzeigt. Dieser datengetriebene Leitfaden liefert: Slice-Definitionen, Image-Output-Snapshot, Languages-vs-Market-Share, Anbieterwoche, sechs Schritte, Drei-Spur-Matrix, Fallstudie, Referenzzahlen und Abnahme-Checkliste.

1. Problemdefinition: Gesamt- und Images-Eingabe-Charts wählen keine Bildgeneratoren

(1) Dimensionsfehler: Gesamt-#1 MiMo-V2-Pro misst Text-Token-Volumen, nicht „Poster pro Woche“. Der 0528-Images-Slice erfasst Bildverständnis (Screenshot-QA, OCR); Image Output zählt Modelle mit output_modalities inkl. image, oft $/Bild (Grok Imagine ab ~$0,05/Bild). (2) Languages-Falle: Default English suggeriert „Englisch-Chart = bestes Modell für meine Nutzer“ — Market Share zeigt Xiaomi, Alibaba, MiniMax dominant. (3) Abrechnungssplit: ComfyUI lokal („nur Strom“) plus ungeprüfte OpenRouter-Bild-APIs → Monatskostenexplosion. (4) Unified Memory: ComfyUI Flux + API-Batch auf M3 36GB → häufig OOM/Swap. (5) Release-Woche: Step 3.7 Flash, Claude Opus 4.8 Fast trenden, verdrängen Flux/Grok im Image Output nicht.

Für DSGVO-sensible Teams in der EU: Bildgenerierung über US-Anbieter (xAI, Google) erfordert dokumentierte Verarbeitungszwecke; Market Share dient der Fallback-Reihenfolge, nicht der Rechtsbewertung. Messbare KPI: $/Bild p50/p95, OOM-Rate, TTFT API vs. lokale ComfyUI-Pipeline.

(6) Release-Rauschen vs. Produktionsrouting: Step 3.7 Flash und Claude Opus 4.8 Fast erscheinen in Trending und Community-Feeds, verschieben aber nicht die strukturelle Spitze von Image Output. Wer wöchentlich nur „was ist neu“ verfolgt, verpasst die stabile Dreiergruppe Flux / Grok / Recraft. (7) IDE-Defaults: Cursor, Cline und Agent-Frameworks wählen weiterhin Text-#1 aus dem Gesamtchart — für Poster, Thumbnails und E-Commerce-Kataloge braucht es einen separaten Policy-Block mit modalities und $/Bild-Caps. (8) Audit-Pflicht: ComfyUI lokal liefert reproduzierbare Seeds und Workflow-JSON; reine API-Generierung ohne Export erschwert Marken-Freigaben — hybride Architektur (API tags, ComfyUI nachts) ist für Agenturen die normative Lösung.

2. Messgrößen: Image Output × Languages × Market Share (KW 2026-05-29)

SliceMetrikTypische FehllesungMac-Nutzung
Image OutputGeneriertes Bildvolumenidentisch mit Images-EingabePoster, E-Commerce, Thumbnails
LanguagesPrompt-Sprachverteilung„stärkstes Modell pro Sprache“UI-Locale vs. Modellhersteller trennen
Market ShareToken-Anteil nach AutorCompliance-UrteilKosten, Fallback-Vendor
Images (Eingabe)Verstehens-Trafficfür Generierung nutzbarsiehe Post 28.05.
Top ModelsGesamt-Wochen-TokensUniversal-Defaultreiner Text (Post 25.05.)

Wöchentlicher Ops-Run: Image Output + Market Share gemeinsam exportieren; bei zweisprachigen Produkten English-Languages-Slice mit Ist-Locales abgleichen. OpenRouter-Doku: modalities: ["image"] oder ["image","text"]; Models-API-Filter architecture.output_modalities.

Datenquellen-Trennung für Reporting: (A) Plattform-Traffic aus Rankings-Slices — relativ, wöchentlich vergleichbar; (B) eigene Rechnung aus OpenRouter Dashboard — absolut in USD; (C) lokale ComfyUI-Kosten — Strom + Amortisation Hardware. Nur (B)+(C) in CFO-Slides mischen, wenn (A) als Routing-Begründung dokumentiert ist. Für Mac-Teams empfiehlt sich ein Spreadsheet mit Spalten: Modell-ID, Slice-Rang, $/Bild Ist, Latenz p95, OOM Ja/Nein, Sprach-Sonde EN/DE Gewinnrate.

3. Image-Output-Snapshot (Referenzwoche 29.05.2026)

TierModell-ID (Beispiel)Use CaseMac-PfadPreisindikator
T1black-forest-labs/flux.2-pro, flux.2-maxProduktfoto, Brand-KVAPI; ComfyUI A/B$/Bild, Flex-Tarif
T2x-ai/grok-imagine-image-qualityMehrsprachiger Text im BildAPI; Tages-Cap~$0,05/Bild
T3recraft/* V4.1SVG, VerläufeAPIpro Bild
T4google/gemini-3.1-flash-image-previewText+Bild eine AnfrageAPIgemischt
T5ComfyUI + Flux/SDXLNacht-Batch, auditierbarlokal / Remote 128GBStrom + Amortisation

Überlappung Image Output ↔ Images-Eingabe typisch <35 % (wöchentlich validieren). Budget-Trennung empfohlen: Sub-Key „Review-Agent“ (Gemini Flash, 0528) vs. „Asset-Gen“ (Flux.2 / Grok). Flux.2 Pro: 4MP-Editing, Konsistenz; Grok Imagine: 1K/2K, Text im Bild mehrsprachig.

Technische Abnahme pro Tier: T1 Flux — Kantenschärfe und Hautton auf Mac-Display kalibriert messen; T2 Grok — OCR-ähnliche Lesbarkeit deutscher Umlaute in 1024²; T3 Recraft — SVG-Export in Figma ohne Pfad-Bruch; T4 Gemini image preview — Latenz bei gemischtem Text+Bild-Request; T5 ComfyUI — VRAM-Kurve über 20 sequentielle Jobs (Activity Monitor). Wer nur einen Tier testet, unterschätzt Hybridkosten: viele Teams landen bei 60 % API (Iteration) und 40 % lokal (Nacht-Batch) nach vier Wochen Daten — nicht 0/100 aus Bauchgefühl.

4. Languages: English-UI vs. chinesisch dominierter Market Share

Öffentliche Aggregate Ende Mai 2026: sechs chinesische Anbieter zusammen ~59,6–60 %+ Wochen-Tokens; MiMo-V2-Pro allein ~21,1 % vs. OpenAI ~7,5 % (Drittquellen). Konsequenz für Metriken: viele englische Prompts routen auf chinesische Basismodelle (Kosten). Mac-Abnahme: 50 EN + 50 DE/ZH Poster-Prompts pro Kandidat; erfassen Lesbarkeit eingebetteter Schrift, kulturelle Entitäten, Layout. Programming: MiMo+Qwen ~49 % Coding-Tokens — relevant für „englische UI, chinesischer Ops“-Dualrouting.

Languages misst Prompt-Sprache, nicht Modell-Herkunft. Für den DACH-Markt: Deutsch-Prompts separat gegen English-Chart benchmarken; Market Share für Text-Fallback (Qwen, DeepSeek), nicht für Bild-Default.

Praxisbeispiel E-Commerce: UI auf Deutsch, 70 % Prompts technisch auf Englisch (Produkt-SKUs, SEO-Keywords). Der Languages-Slice „English“ überschätzt scheinbar den „englischen Markt“, während Qwen oder MiMo die Inferenz ausführen. Abnahme: gleiche 20 Produkt-Prompts in DE und EN an Flux.2 Pro und Grok Imagine — Diff der eingebetteten Schrift und der Farbabweichung (ΔE in ColorSync-Vorschau) protokollieren. Programming-Korrelation: Teams mit hohem MiMo+Qwen-Anteil im Coding-Chart sollten nicht automatisch dieselben IDs für Bilder wählen — separate Policy-Datei image-routing.yaml versionieren.

5. Market Share: Anbieterwoche und Mac-Vendor-Strategie

AnbieterFlaggschiff~AnteilMac-Hinweis
XiaomiMiMo-V2-Pro~21,1 %Text-Default; Bild: Flux/Grok
AlibabaQwen 3.6 / 3.7 Max~13,9 %+Langkontext, zweisprachige Agenten
MiniMaxMiniMax M2.7~8,1 %hoher Text-Durchsatz
OpenAIGPT-5.5~7,5 %Compliance-Fallback EU/US
AnthropicClaude Opus/Sonnet 4.8trend ↓Schwere Textaufgaben, kein Bild-Default

Analysierte Woche 27.04.–03.05.: CN-Modelle 7,942T (+81,7 % WoW), US-Modelle -34,6 %. Market Share = Fallback-Reihenfolge bei Rate-Limit; Image Output Top-3 bei Generierung fixieren — MiMo nicht für Bildausgabe erzwingen.

Szenario Rate-Limit: MiMo #1 im Text fällt auf Qwen3.7 Max, während Image Output unverändert flux.2-pro bleibt — zwei unabhängige State-Machines in Ihrer routing.yaml. Szenario Preiserhöhung Grok: Fallback recraft oder gemini-3.1-flash-image-preview nur nach erneuter 20-Bild-Sonde, nicht blind. Für Mac-FinOps: monatliche Pivot-Tabelle Anbieter × Modalität (text/image) × Kosten — verhindert, dass 60 %+ CN-Token im Text die Wahrnehmung „wir sind bereits China-first für alles“ erzeugen, während Bilder teuer bei BFL/xAI bleiben.

6. Sechs Schritte: drei Slices → Mac-Bild-Routing

Schritt 1 — Wöchentlich Image Output + Market Share ziehen

openrouter.ai/rankings; Languages mindestens English plus Produkt-Locales (DE/EN/ZH). Screenshot mit Datum im Dateinamen archivieren; bei Series-B-News (25T/Woche) nicht die Slice-Filter vergessen — ohne Filter „Image Output“ landen Sie erneut im Gesamtchart.

Ergänzend: OpenRouter-Dashboard nach Modell-ID filtern und wöchentliche Top-5 nach $ sortieren — Abweichung >15 % gegenüber Vorwoche triggert Re-Run der Sechs-Schritte-Sonde, auch wenn der öffentliche Chart unverändert wirkt (Preisänderungen sind unsichtbar im Ranking).

Schritt 2 — Models API: output_modalities image

Pricing exportieren ($/Bild vs. Token); JSON versionieren unter /tmp/or-image-out-YYYYMMDD.json.

Schritt 3 — Verstehen vs. Generieren budgetieren

Images-Eingabe → Gemini Flash (0528); Image Output → Flux.2 / Grok — getrennte Sub-Keys.

Schritt 4 — ComfyUI vs. API A/B

Identischer Prompt, je 20 Bilder: Latenz, $/Bild, Textgenauigkeit im Bild.

Schritt 5 — Zweisprachige Poster-Sonde

30 EN + 30 DE (oder ZH): Grok (Schrift) vs. Flux (Ästhetik) — Gewinnrate dokumentieren. Ergebnis als CSV mit Spalten Modell, Sprache, Lesbarkeit 1–5, $/Bild, p95 Latenz — Grundlage für das wöchentliche Routing-Review mit Finance und Creative Lead.

Schritt 6 — Nacht-Queue >200 Bilder → Remote Mac

MACGPU-Node; tags nur Workflow-Iteration auf dem Laptop. launchd-Plist mit Startfenster 22:00–06:00, Fehler-Webhook bei >2 % Failed Jobs; geteiltes SMB-Volume für Freigabe an Keynote/Final Cut am Morgen.

Governance zwischen den Schritten: (i) wöchentliches Diff der Models-API-Preise vs. Budget; (ii) Alarm bei $/Tag >120 % des 4-Wochen-Schnitts; (iii) quartalsweise Re-Validierung der <35 %-Overlap-Annahme zwischen Image Output und Images-Eingabe. Ohne diese drei Kontrollpunkte driftet selbst ein einmal korrektes Routing innerhalb von zwei Release-Zyklen (neue Gemini-Image-Preview, Recraft-Minor) zurück in Teuer-Defaults.

curl -s "https://openrouter.ai/api/v1/models" \ | jq '.data[] | select(.architecture.output_modalities[]? == "image") | {id, pricing}' \ > /tmp/or-image-out-$(date +%Y%m%d).json curl -s https://openrouter.ai/api/v1/chat/completions \ -H "Authorization: Bearer $OPENROUTER_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "black-forest-labs/flux.2-pro", "messages": [{"role": "user", "content": "Produktfoto, weißer Hintergrund, 4K"}], "modalities": ["image"] }'

7. Drei-Spur-Matrix: ComfyUI / OpenRouter API / Remote Mac

SzenarioSpurKonfigurationAbnahme (messbar)
Einzel-Poster-IterationAPIGrok Imagine / Flux.2 Flex<25s, <$0,08/Bild
Marken-Asset-BibliothekComfyUI lokalFlux.1 + Metal20 Bilder ohne OOM
500+ Bilder/NachtRemote-QueueComfyUI headless<2 % Fehler in 8h
DE/EN Text im BildAPIGrok Imagine QualityLesbarkeit >90 %
Review-Agent parallelAPI Dual-BucketGemini Images + Flux OutRechnungen trennbar
Compliance EU KundeAPI + Audit-LogFlux API + ComfyUI SeedsHerkunft pro Asset
A/B MarkenkampagneHybrid10 API + 10 ComfyUIΔE <3 vs. Referenz

Die Matrix ist bewusst betriebsnah: Spalte „Abnahme“ verhindert Diskussionen ohne Zahl. Wer „Einzel-Poster“ auf API Grok legt, aber p95 >25s sieht, wechselt zuerst Region/Modell-Variante, nicht blind zu lokalem Flux — andernfalls steigt Engineering-Zeit ohne $/Bild-Gewinn. Remote-Mac-Spur (MACGPU M4 Max 128GB) lohnt sich, sobald Nacht-Batch >3h oder Swap >10GB beobachtet wird — messbar im Activity Monitor über „Memory Pressure“ und „Swap Used“.

8. Fallstudie: Cross-Border-DTC, Bildkosten −41 %

„6-köpfiges DTC-Team, Mac Studio M2 Ultra 64GB: alle Poster über Claude-Multimodal-Dialog ($4.100/Monat OpenRouter). Nach Image-Output-Chart: Generierung → Flux.2 Pro + Grok Imagine ($/Bild), Claude nur Copy; Languages-Sonde: 40 % Prompts faktisch DE/ZH → Qwen für Text, Grok für Bild; 800 Bilder/Woche → MACGPU M4 Max ComfyUI Nacht-Queue. 30 Tage: $2.420 (−41 %); tags kein ComfyUI∥Claude-Swap.“

Kernmetrik: Hauptkostentreiber = Dialogmodell für Bilder + fehlender Split Images-Eingabe / Image Output. Market Share 60 %+ CN = Text/Ops, nicht Bild-Default.

Detailierte Vorher/Nachher-Tabelle (Fall): Vorher — 100 % Bilder via Claude Sonnet/Opus Multimodal, ~$0,12–0,18 effective $/Bild inkl. Text-Tokens; Nachher — Flux.2 Pro ~$0,06–0,08, Grok Poster ~$0,05, Claude nur Copy ~$400/Monat Text. ComfyUI-Nacht: 800 Bilder/Woche à ~$0,01 amortisierte Hardware-Kosten vs. $0,05+ API. Sprach-Sonde: 40 % Prompts DE/ZH → Qwen für Prompt-Rewrite reduzierte Grok-Retries um 18 %. Technisch: unified memory tags frei für Figma/Keynote, kein Swap-Spike 14–17 Uhr. Lessons learned: Rankings lesen als zwei Achsen (Vendor vs. Modalität), nicht als eine „Best Model“-Liste.

9. Prognose: Bild-Chart und Anbieter-Chart divergieren dauerhaft

Bei ~25T Tokens/Woche: Text-Ostverschiebung, Image Output West-Spezialisten (BFL, xAI, Google, Recraft). H2 2026: IDE/Agenten setzen modalities: ["image"] standardmäßig; Languages granularer (DE, ES, JP). Apple Silicon: ColorSync, Final Cut-Handoff, launchd-Nachtqueues — Windows/Linux-Cloud-GPU ohne diese Pipeline.

64GB reicht nicht für Tag-Bearbeitung + 500 API-Bilder: Remote Apple Silicon (MACGPU M4 Max 128GB, ComfyUI Flux + OpenRouter-Skript-Queue); Laptop nur Review-Agent und Prompt-Iteration — gleiche Routing-Tabelle, getrennte Lastspitzen.

Vergleich Windows/Linux-Cloud-GPU: CUDA-Cluster liefern rohen Durchsatz, fehlen aber an der nahtlosen P3/Display-P3-Vorschau und an stabiler Metal-ComfyUI-Nachtlast ohne Treiber-Neustart-Pflicht. Für europäische Agenturen mit DSGVO-Anforderungen bleibt dokumentierbarer Workflow (lokale Seeds + API-Stichproben) auf Mac oft schneller freigabefähig als reine US-Cloud-Batch-Jobs ohne Asset-Herkunft. Die Divergenz „Text-Ost / Bild-West“ wird 2026 H2 weiter zunehmen, sobald Agenten standardmäßig Bilder erzeugen — frühe Trennung der Budget-Buckets ist günstiger als nachträgliche Rechnungs-Aufteilung.

10. Referenzzahlen, FAQ & Abnahme

① ~25T Tokens/Woche (26.05.). ② CN-Anbieter >60 %. ③ MiMo ~21,1 %. ④ Grok Imagine ~$0,05/Bild. ⑤ Fall $4.100→$2.420 (−41 %). ⑥ Overlap Image Output / Images-Eingabe <35 % (wöchentlich messen). ⑦ Programming MiMo+Qwen ~49 % Coding-Tokens. ⑧ WoW CN +81,7 % / US −34,6 % (Analysewoche Apr 27–Mai 3). ⑨ ComfyUI-Durchsatz M4 Max 128GB typisch 40–60 Bilder/h Flux-Workflow. ⑩ Ziel p95 API-Einzelposter <25s bei <$0,08/Bild.

Verknüpfung zur MACGPU-Serie: Post 0525 liefert Gesamt-Entscheidungsmatrix; 0526 Programming für IDE; 0527 Tool Calls für Agenten; 0528 Images/Context/Audio für Verstehen — dieser Post 114 schließt Generierung + Sprach-Slice + Anbieteranteil. In der Praxis reicht ein gemeinsames Notion- oder Confluence-Board mit wöchentlichen Screenshots der drei Slices plus Ihrer Ist-Rechnung — so bleibt die Routing-Policy für das ganze Team nachvollziehbar, wenn Modelle wöchentlich rotieren. Bei Abweichung >20 % zwischen Chart-Rang und Ihrem $/Bild-Ist: zuerst Pricing-JSON diffen, dann Sonde wiederholen — nicht sofort den Anbieter wechseln.

0528 Images-Charts noch nötig? Ja — Verstehen bleibt dort. Nur English Languages? Nein — Market Share + Ist-Locale. Flux lokal ersetzen? ComfyUI approximiert; API-Stichprobe für Flagship-Ästhetik. Warum zwei OpenRouter-Keys? Damit Dashboard und Alerts getrennt „Review“ vs. „Generate“ melden. Remote Mac Pflicht? Ab ~200 Bildern/Nacht oder 36GB OOM — dann ja. Recraft vs. Flux? Recraft für SVG/Vektor-Look; Flux für fotorealistische Packshots.

Abnahme-Checkliste (ausdruckbar): (1) Zwei Budget-Buckets mit Hard-Cap aktiv. (2) Models-JSON wöchentlich archiviert. (3) A/B 20 Bilder pro Pfad mit $/Bild und p95-Latenz. (4) EN+DE Sonde ≥60 Prompts dokumentiert. (5) Nacht-Queue 8h-Lauf <2 % Fail. (6) Kein paralleler Claude-„Bilddialog“ in Produktion. (7) DSGVO-Notiz zu US-Bildanbietern. (8) POST-114 Routing-Tabelle im Team-Wiki verlinkt zu 0525–0528-Serie.