OpenRouter начало июня 2026: Trending vs Top Models — 25T токенов/нед, гнаться за всплеском или держать steady-state на Mac

На openrouter.ai/rankings This Week (Top Models) — кто съел больше всего токенов за неделю; Trending — кто вырос быстрее всех (WoW). Это часто разные семейства. Серия за май: общий рейтинг, Programming, Tool Calls и др.; двойной рейтинг начала июня — токены vs выручка. Здесь — временная ось: ~25T токенов/нед (Series B), снимки ~31,34T, Gemini 3.1 Flash Lite +15% WoW против steady-state гигантов вроде MiMo-V2.5, и как развести потоки на Mac Cursor / OpenClaw без убийства unified memory и Metal-throughput. Вердикт: прод — Top Models + нужный срез; Trending — только gray pool + runbook конца preview. Дальше: 8 рейтингов — 3 архетипа — 6 шагов — матрица — кейс — чеклист.

1. Пять способов, как Trending ломает прод

(1) +15% WoW ≠ «модель сильнее везде»: всплески Flash/Lite — цена, free-preview, заливка Agent-трафиком, не SWE-bench. (2) Смотреть только #1 Top Models: MiMo-V2.5 — нормальный default Agent; Qwen 3.6 Plus Preview после биллинга может потерять половину throughput. (3) 8 рейтингов в вакууме: Programming #1 + Images #1 в одном fallback — тихая деградация мультимодала. (4) Не сменили route после preview: старый model id в OpenClaw — счёт ×2 за ночь. (5) В прод без приёмки на Mac: влезает ли Trending-модель в 36 GB unified memory под MLX — решает, вернёте ли spike на Metal или оставите на API/remote.

2. Восемь срезов rankings: метрика и Mac-контур

Срез	Что меряет	Mac-маршрут
Top Models	Суммарные недельные токены	Прод-default, OpenClaw primary
Trending	Макс. WoW-рост	Gray pool, A/B, time-boxed fallback
Market Share	Доля вендора	Концентрация, compliance
Languages	По языку	Разные default RU/EN/ZH
Programming	По языку кода	Cursor / Cline
Context Length	Длина prompt	Long RAG vs короткий чат
Tool Calls	Объём tool calls	Agent / OpenClaw stack
Images / Image Output / Audio	Мультимодал	Vision Agent, ComfyUI+Metal vs API

Правило связки: зафиксировать тип нагрузки → открыть срез; Trending в gray только если модель в Top 10 этого же среза — иначе один всплеск отравит глобальный default.

3. Масштаб платформы: 25T–31,34T/нед — что это для throughput

Series B: ~25T токенов/нед (~×5 к ~5T полгода назад); публичные endpoint-снимки конца мая ~31,34T. Следствия: (1) default Agent — еженедельный пересмотр, не раз в квартал; (2) китайские open-source — часто 60%+ токенов, дёшево, residency отдельно; (3) WoW +12%…+432% — рутина, нужен скрипт «spike diff», не ручной скролл rankings. На Mac это бьёт по пропускной способности Metal/MLX и по лимитам удалённого узла — планируйте gray так, чтобы не забить bandwidth Gateway.

4. Три архетипа: spiker / stable / declining

Тип	Сигнал	Примеры (публично)	Mac-стратегия
Spiker	Trending вверху, WoW двузначный+	Gemini 3.1 Flash Lite (+15%), Qwen 3.6 Plus Preview (новый Top 5)	5–10% gray; календарь конца preview
Stable	Top Models #1–#3 долго	MiMo-V2-Pro/V2.5, DeepSeek V4, MiniMax M2.7	Прод + MLX size-check на Metal
Declining	Доля в Top 10 падает	Часть GPT-5.x (~-8% относительной доли)	Dollar-track fallback, не Agent-default

5. Дерево решений (компакт)

Нагрузка → срез
├─ IDE код        → Programming + Top Models (stable)
├─ OpenClaw Agent → Tool Calls + Top Models; Trending = хвост fallback
├─ Long RAG       → Context Length (>32K) + локальный MLX/Metal или API
├─ Картинки       → Image Output; ComfyUI на Metal сначала
└─ Два языка      → Languages — не один model на всё

Trending → прод (все три):
  ① Top 10 целевого среза  ② 50 regression prompts  ③ preview price / Provider в журнале
                

6. Шесть шагов: rankings → openclaw.json / Cursor

Шаг 1 — снимок в понедельник

Top 5 Top Models + Top 5 Trending, пометить WoW%.

Шаг 2 — срез = workload

Код → Programming; Agent → Tool Calls; общий рейтинг не заменяет срез.

Шаг 3 — Trending в gray

В конец fallback; не больше 10% сессий.

Шаг 4 — runbook конца preview

Календарь; в день смены цены — model id + openclaw doctor.

Шаг 5 — три полосы на Mac

Stable, если квантуется MLX — днём локально на Metal; spiker — сначала remote Mac regression; тяжёлое — Dollar-track (см. двойной рейтинг). Ноутбук 36 GB — под ревью, не под экспериментальный flood.

Шаг 6 — недельный разбор

$/1M, P95, статус preview; declining выкинуть из default chain.

7. Матрица трёх полос

Сценарий	Top Models	Trending	Контур
Cursor completion	✅ stable дешёвый	❌ не default	Локальный MLX/Metal или OpenRouter
OpenClaw 7×24	✅ primary	⚠️ только хвост fallback	Remote Mac Gateway (launchd)
Проба модели	❌	✅ gray	Remote Mac sandbox
Free preview	❌ не долгий default	✅ time-box	Миграция в день X

8. Кейс: погоня за Trending → stable + gray

«Команда из 8 Mac поставила Qwen 3.6 Plus Preview (Trending #2) default OpenClaw. Две недели free preview — 9,2B токенов/мес. Paid без смены конфига: $1 100 → $4 600/мес. Разбор: код должен был идти по Programming DeepSeek V4 Flash; Preview — только 10% gray. Откат на MiMo-V2.5 + gray Preview + auto-downgrade в billing day — следующий месяц $2 050, −55%, Trending всё ещё в A/B gray.»

Trending — сигнал, не прод-default. Ортогонально двойному рейтингу: деньги vs время.

9. Рынок ускоряется; Mac — контрольная стойка Metal

При 25T+ токенов/нед циклы моделей короче релизов «обычного» софта. Stealth и free-preview всплески — норма. Ценность Apple Silicon: offline baseline stable через MLX/Ollama на Metal; кандидаты Trending — Agent-regression на удалённом Mac, Cursor на ноутбуке — steady-state, 36 GB unified memory не под эксперимент. Linux/Windows тоже дергают OpenRouter, но launchd Gateway 24/7, параллель Xcode/FCP, Metal sidecar inference на macOS проще стыковать. Удалённые узлы MACGPU физически режут gray Trending от прода; ноут — ревью и Dollar-fallback.

10. Цифры и чеклист приёмки

(1) Токены/нед: ~25T (Series B), снимок ~31,34T. (2) Китайские модели: 60%+ токенов. (3) Всплески: Gemini 3.1 Flash Lite +15% WoW; Qwen 3.6 Plus новый Top 5. (4) Preview→paid: $4 600 → $2 050 (−55%).

В: Trending + двойной рейтинг? Двойной — объём vs деньги; Trending — пробовать ли на этой неделе. В: Programming для IDE? Да, обязательно. В: MACGPU? Remote — gray и steady Agent; ноут — MLX baseline на Metal и дорогой fallback.