2026 OPENROUTER
IMAGE_
OUTPUT_
LANGUAGES_
MAC.
На openrouter.ai/rankings после Series B (26.05.) платформа держит ~25T токенов/нед. Общий рейтинг, Programming, Tool Calls и трио Images/Context/Audio закрывают текст, агентов и входное multimodal — но Image Output (генерация) и срез Languages оставались без отдельного разбора. Конец мая: в Image Output лидируют Flux.2 Pro, Grok Imagine, Recraft V4.1; в Market Share китайские вендоры >60% недельных токенов при UI Languages по умолчанию English. Ниже: спецификация срезов, снимок Image Output, Languages vs Market Share, 6 шагов, трёхполосная матрица Metal/ComfyUI/API/remote, кейс, метрики приёмки.
1. Ошибка измерения: общий и Images-input рейтинг не выбирают генератор
(1) Разные оси: #1 MiMo-V2-Pro — объём текстовых токенов, не throughput «постеров/нед». Срез Images (0528) — vision input (OCR, screenshot QA); Image Output — модели с output_modalities: image, тарификация часто $/image (Grok Imagine от ~$0.05/img). (2) Languages trap: дефолт English ≠ лучшая модель для RU/ZH prompt. (3) Billing: смешение ComfyUI (только электричество + amortization GPU) и API без split → взрыв счёта. (4) Unified memory: ComfyUI Flux на Metal + пачка OpenRouter image requests на M3 36GB → OOM, swap, деградация Metal command buffer. (5) Релизы недели: Step 3.7 Flash, Opus 4.8 Fast в Trending не сдвигают верх Image Output (BFL/xAI).
Для Mac-инженера KPI: p50/p95 latency API, $/image, OOM rate, overlap моделей между срезами (<35% типично). Не путать Market Share с compliance-вердиктом — только порядок fallback при rate-limit.
(6) Release noise: Step 3.7 Flash и Opus 4.8 Fast в Trending не сдвигают верх Image Output — routing policy держать на Flux/Grok/Recraft. (7) IDE defaults: Cursor/Cline тянут text #1 из общего рейтинга — для poster/thumbnail нужен отдельный блок с modalities и hard cap $/day. (8) Audit: ComfyUI даёт seed + workflow JSON; чистый API без экспорта ломает brand approval — гибрид «день API, ночь ComfyUI» — норма для продакшена.
2. Спецификация срезов: Image Output × Languages × Market Share
| Slice | Что считает | Типичная ошибка | Mac-применение |
|---|---|---|---|
| Image Output | Трафик генерации | = Images input | постеры, e-com, thumbs |
| Languages | язык prompt | «лучшая модель на язык» | UI locale ≠ vendor |
| Market Share | доля токенов по автору | = legal verdict | cost, fallback order |
| Images (input) | vision understanding | выбор генератора | см. POST 28.05. |
| Top Models | все токены/нед | universal default | чистый текст (25.05.) |
Еженедельно: экспорт Image Output + Market Share; для bilingual — English slice vs фактические RU/EN/ZH prompt. OpenRouter: modalities: ["image"] | ["image","text"]; фильтр Models API architecture.output_modalities.
Reporting: (A) относительный трафик из rankings slices; (B) абсолютный USD из dashboard; (C) локальный ComfyUI — электричество + amort GPU. В CFO deck смешивать только (B)+(C), если (A) задокументирован как обоснование routing. Таблица инженера: model_id, rank в slice, $/img факт, p95 latency, OOM Y/N, win-rate EN/RU sonde.
3. Снимок Image Output (неделя 2026-05-29)
| Tier | model id | нагрузка | Mac path | метрика цены |
|---|---|---|---|---|
| T1 | black-forest-labs/flux.2-pro, flux.2-max | product, brand KV | API; ComfyUI A/B на Metal | $/image |
| T2 | x-ai/grok-imagine-image-quality | текст в кадре, multilingual | API; daily $ cap | ~$0.05/img |
| T3 | recraft/* V4.1 | SVG, gradients | API | per image |
| T4 | google/gemini-3.1-flash-image-preview | text+image one shot | API | mixed |
| T5 | ComfyUI + Flux/SDXL | ночной batch, аудит assets | local / remote 128GB UMA | power + amort |
Пересечение лидеров Image Output и Images-input обычно <35% — валидировать curl+jq еженедельно. Flux.2 Pro: 4MP edit, consistency; Grok Imagine: 1K/2K, сильный in-image text. Split OpenRouter keys: bucket «review agent» (Gemini, 0528) vs «asset gen» (Flux/Grok).
Acceptance per tier: T1 Flux — edge sharpness на Retina, skin tone; T2 Grok — кириллица in-frame readable @1024²; T3 Recraft — SVG path integrity; T4 Gemini image — mixed text+image latency; T5 ComfyUI — VRAM slope 20 sequential Metal jobs. Hybrid после 4 недель данных часто 60% API iterate / 40% local night — не 0/100 по интуиции. Metal command buffer saturation на M3 36GB при parallel API download + ComfyUI — измерять Activity Monitor → решение remote 128GB UMA.
4. Languages: English UI vs CN-доминированный Market Share
Публичные агрегаты конца мая: шесть CN-вендоров ~59.6–60%+ недельных токенов; MiMo-V2-Pro ~21.1% vs OpenAI ~7.5% (third-party). Следствие: масса EN prompt маршрутизируется на CN base models по $/token, не по Languages chart. Приёмка на Mac: 50 EN + 50 RU/ZH poster prompts на кандидата; логировать readable in-image text, cultural entities, layout drift.
Programming slice: MiMo+Qwen ~49% coding tokens — dual route «EN IDE + CN ops». Market Share задаёт text fallback; Image Output — фиксированный top-3 для генерации, без попыток вывести картинку из MiMo.
RU prompt часто latinize product SKUs — Languages slice покажет English, vendor останется CN. Тест: 50 RU marketing prompts vs 50 EN — сравнить glyph error rate Grok vs Flux. Для mixed RU+EN in one poster — Grok Imagine Quality обычно выигрывает; для photoreal packshot без текста — Flux.2 Pro. Document wins in spreadsheet — иначе спор «какой chart прав» без данных.
5. Market Share: vendor week и стратегия на Apple Silicon
| Vendor | flagship | ~share | Mac note |
|---|---|---|---|
| Xiaomi | MiMo-V2-Pro | ~21.1% | text default; image → Flux/Grok |
| Alibaba | Qwen 3.6 / 3.7 Max | ~13.9%+ | long ctx agents |
| MiniMax | M2.7 | ~8.1% | high QPS text |
| OpenAI | GPT-5.5 | ~7.5% | compliance fallback |
| Anthropic | Claude 4.8 | trend ↓ | hard text, not image default |
Неделя 27.04–03.05: CN models 7.942T (+81.7% WoW), US -34.6%. Market Share = порядок переключения при 429/price spike; генерация — по Image Output, не по доле MiMo.
Rate-limit scenario: text fallback MiMo→Qwen3.7 Max, image lane stays flux.2-pro — две state machines в routing.yaml. Grok price spike: fallback recraft/gemini-image только после 20-img sonde. FinOps pivot: vendor × modality × $/month — CN 60%+ text tokens не означает CN-first для image (BFL/xAI остаются дорогими западными линиями).
6. Шесть шагов: три среза → Mac image routing
Шаг 1 — Weekly pull Image Output + Market Share
openrouter.ai/rankings; Languages: English + фактические локали продукта.
Шаг 2 — Models API filter output_modalities image
jq export pricing → /tmp/or-image-out-YYYYMMDD.json.
Шаг 3 — Split budgets understand vs generate
Images input → Gemini (0528); Image Output → Flux.2 / Grok — отдельные sub-keys.
Шаг 4 — A/B ComfyUI Metal vs API
Один prompt × 20 images: wall time, $/img, text accuracy in frame.
Шаг 5 — Bilingual poster probe
30 EN + 30 RU: Grok (glyphs) vs Flux (aesthetics) — win rate в CSV: model, locale, readability 1–5, $/img, p95 — input для weekly routing review с finance и creative lead; без CSV споры бесконечны.
Шаг 6 — Night queue >200 img → remote Mac
MACGPU node; laptop днём только workflow iterate. launchd 22:00–06:00, webhook при fail >2% за 8h, SMB share для Final Cut/Keynote утром.
Governance: weekly diff Models API pricing; alert при daily spend >120% от 4-week avg; quarterly re-test overlap <35% Image Output vs Images-input. Без этого routing дрейфует за 2 release cycles (новый Gemini image preview, Recraft patch).
7. Трёхполосная матрица: ComfyUI/Metal | OpenRouter API | remote Mac UMA
| сценарий | полоса | config | acceptance |
|---|---|---|---|
| single poster iterate | API | Grok / Flux Flex | <25s, <$0.08/img |
| brand asset lib | local ComfyUI | Flux.1 Metal | 20 img 0 OOM |
| 500+ img/night | remote queue | headless ComfyUI | <2% fail / 8h |
| RU/EN in-image text | API | Grok Quality | readable >90% |
| review agent ∥ gen | dual API bucket | Gemini + Flux | bills split |
| compliance EU client | API + audit log | Flux API + ComfyUI seeds | provenance per asset |
| brand A/B | hybrid | 10 API + 10 ComfyUI | ΔE <3 vs ref |
Matrix column «acceptance» blocks opinion-only debates. If single-poster API p95 >25s — switch region/model variant before local Flux (avoid engineering time without $/img win). Throughput target on M4 Max 128GB: 40–60 ComfyUI images/hour Flux workflow типовой — планируйте queue depth исходя из SLA, не из marketing TPS. Remote MACGPU node оправдан при night batch >3h или swap >10GB — смотрите Activity Monitor Memory Pressure и Swap Used на M3 36GB до миграции queue.
8. Кейс: cross-border DTC, −41% на image line item
«6 FTE, Mac Studio M2 Ultra 64GB UMA: все «картинки» через Claude multimodal chat — $4,100/mo OpenRouter. После Image Output routing: gen → Flux.2 Pro + Grok ($/img), Claude только copy; Languages probe: 40% prompt фактически ZH → Qwen upstream, Grok render; 800 img/week → MACGPU M4 Max 128GB ComfyUI night queue (Metal batch, 0 daytime swap). 30d: $2,420 (−41%); unified memory днём не saturated.»
Root cause: dialog model для image gen + no split Images input / Image Output. CN 60%+ Market Share — text/ops, не default image vendor.
Before/after: Claude multimodal ~$0.12–0.18 effective $/img → Flux.2 ~$0.06–0.08, Grok ~$0.05, Claude copy only ~$400/mo text. ComfyUI night 800 img/week ~$0.01 amortized vs $0.05+ API. Qwen upstream on RU prompts −18% Grok retries. UMA freed for Figma afternoon — no 14:00–17:00 swap spike. Lesson: rankings = two axes (vendor vs modality), not single «best model».
Engineering note: при интеграции в CI добавьте smoke test — один modalities: ["image"] request на flux.2-pro и grok-imagine с timeout 30s; fail build если pricing JSON не содержит output_modalities image. Для MLX/Metal локально — отдельный job не смешивать с API quota alerts.
9. Прогноз: расхождение image chart и vendor chart — структурное
При ~25T tokens/week: text token drift east, Image Output west specialists (BFL, xAI, Google, Recraft). H2 2026: IDE/agents default modalities: ["image"]; Languages granular (JP, ES…). Apple Silicon: один чип — Metal preview + ColorSync + VideoToolbox; launchd night queue без Windows cloud GPU friction. 64GB insufficient для day edit + 500 API images/night → remote UMA 128GB (MACGPU M4 Max): ComfyUI Flux pipeline + OpenRouter script queue; laptop — review agent + prompt only.
H2 2026 agents будут слать image tool calls параллельно text — без split buckets счёт вырастет ступенькой. Заложите сейчас: hard cap $/day на image bucket, separate alert channel Slack/Telegram, weekly review POST-114 metrics с 0525–0528 series links. CUDA farm не заменит ColorSync handoff в post-production — Mac remote node остаётся TCO-optimal для hybrid creative shops в СНГ и EU, экспортирующих на Zapier/Shopify EN storefront с RU ops prompts.
10. Цифры, FAQ, чеклист приёмки
① ~25T tokens/week (26.05.). ② CN vendors >60%. ③ MiMo ~21.1%. ④ Grok ~$0.05/img. ⑤ $4,100→$2,420 (−41%). ⑥ Image Output ∩ Images-input <35%. ⑦ MiMo+Qwen ~49% coding tokens. ⑧ WoW CN +81.7% / US −34.6% (week Apr27–May3). ⑨ M4 Max 128GB ComfyUI ~40–60 img/h Flux. ⑩ Target p95 single poster <25s, <$0.08/img.
POST-114 закрывает серию 0525 (общий), 0526 (code), 0527 (agents), 0528 (input multimodal) блоком генерации + Languages + Market Share. Shared board: weekly screenshots трёх slices + фактический USD bill — иначе каждый trending release уводит команду на text #1 для poster workload. Metal/MLX на laptop — только dev; production batch image gen на remote UMA 128GB с тем же OpenRouter key и routing.yaml — единая политика cross-machine. Если rank в chart и ваш $/img расходятся >20% — сначала diff pricing JSON, потом повтор sonde, не смена vendor вслепую.
Нужен 0528 Images? Да — understanding. Только English Languages? Нет — Market Share + real locales. Flux local = Pro? ComfyUI approx; API sample для flagship look. Два OpenRouter key? Да — split billing review vs generate. Remote Mac обязателен? От ~200 img/night или OOM на 36GB UMA.
Checklist приёмки: (1) 2 budget buckets + hard cap. (2) Models JSON archive weekly. (3) A/B 20 img/path: $/img, p95. (4) EN+RU sonde ≥60 prompts. (5) Night 8h fail <2%. (6) No Claude «image chat» in prod. (7) Compliance note для US image vendors. (8) Wiki link POST-114 + серия 0525–0528. Windows CUDA cluster даёт throughput, но без ColorSync/P3 preview и стабильного Metal night batch — для creative pipeline на Apple Silicon гибрид остаётся оптимальным по TCO и audit trail.