2026 OPENROUTER
TRENDING_
VS_
TOP_
MODELS.

OpenRouter Trending и Mac-маршрутизация throughput

На openrouter.ai/rankings This Week (Top Models) — кто съел больше всего токенов за неделю; Trending — кто вырос быстрее всех (WoW). Это часто разные семейства. Серия за май: общий рейтинг, Programming, Tool Calls и др.; двойной рейтинг начала июня — токены vs выручка. Здесь — временная ось: ~25T токенов/нед (Series B), снимки ~31,34T, Gemini 3.1 Flash Lite +15% WoW против steady-state гигантов вроде MiMo-V2.5, и как развести потоки на Mac Cursor / OpenClaw без убийства unified memory и Metal-throughput. Вердикт: прод — Top Models + нужный срез; Trending — только gray pool + runbook конца preview. Дальше: 8 рейтингов — 3 архетипа — 6 шагов — матрица — кейс — чеклист.

1. Пять способов, как Trending ломает прод

(1) +15% WoW ≠ «модель сильнее везде»: всплески Flash/Lite — цена, free-preview, заливка Agent-трафиком, не SWE-bench. (2) Смотреть только #1 Top Models: MiMo-V2.5 — нормальный default Agent; Qwen 3.6 Plus Preview после биллинга может потерять половину throughput. (3) 8 рейтингов в вакууме: Programming #1 + Images #1 в одном fallback — тихая деградация мультимодала. (4) Не сменили route после preview: старый model id в OpenClaw — счёт ×2 за ночь. (5) В прод без приёмки на Mac: влезает ли Trending-модель в 36 GB unified memory под MLX — решает, вернёте ли spike на Metal или оставите на API/remote.

2. Восемь срезов rankings: метрика и Mac-контур

СрезЧто меряетMac-маршрут
Top ModelsСуммарные недельные токеныПрод-default, OpenClaw primary
TrendingМакс. WoW-ростGray pool, A/B, time-boxed fallback
Market ShareДоля вендораКонцентрация, compliance
LanguagesПо языкуРазные default RU/EN/ZH
ProgrammingПо языку кодаCursor / Cline
Context LengthДлина promptLong RAG vs короткий чат
Tool CallsОбъём tool callsAgent / OpenClaw stack
Images / Image Output / AudioМультимодалVision Agent, ComfyUI+Metal vs API

Правило связки: зафиксировать тип нагрузки → открыть срез; Trending в gray только если модель в Top 10 этого же среза — иначе один всплеск отравит глобальный default.

3. Масштаб платформы: 25T–31,34T/нед — что это для throughput

Series B: ~25T токенов/нед (~×5 к ~5T полгода назад); публичные endpoint-снимки конца мая ~31,34T. Следствия: (1) default Agent — еженедельный пересмотр, не раз в квартал; (2) китайские open-source — часто 60%+ токенов, дёшево, residency отдельно; (3) WoW +12%…+432% — рутина, нужен скрипт «spike diff», не ручной скролл rankings. На Mac это бьёт по пропускной способности Metal/MLX и по лимитам удалённого узла — планируйте gray так, чтобы не забить bandwidth Gateway.

4. Три архетипа: spiker / stable / declining

ТипСигналПримеры (публично)Mac-стратегия
SpikerTrending вверху, WoW двузначный+Gemini 3.1 Flash Lite (+15%), Qwen 3.6 Plus Preview (новый Top 5)5–10% gray; календарь конца preview
StableTop Models #1–#3 долгоMiMo-V2-Pro/V2.5, DeepSeek V4, MiniMax M2.7Прод + MLX size-check на Metal
DecliningДоля в Top 10 падаетЧасть GPT-5.x (~-8% относительной доли)Dollar-track fallback, не Agent-default

5. Дерево решений (компакт)

Нагрузка → срез ├─ IDE код → Programming + Top Models (stable) ├─ OpenClaw Agent → Tool Calls + Top Models; Trending = хвост fallback ├─ Long RAG → Context Length (>32K) + локальный MLX/Metal или API ├─ Картинки → Image Output; ComfyUI на Metal сначала └─ Два языка → Languages — не один model на всё Trending → прод (все три): ① Top 10 целевого среза ② 50 regression prompts ③ preview price / Provider в журнале

6. Шесть шагов: rankings → openclaw.json / Cursor

Шаг 1 — снимок в понедельник

Top 5 Top Models + Top 5 Trending, пометить WoW%.

Шаг 2 — срез = workload

Код → Programming; Agent → Tool Calls; общий рейтинг не заменяет срез.

Шаг 3 — Trending в gray

В конец fallback; не больше 10% сессий.

Шаг 4 — runbook конца preview

Календарь; в день смены цены — model id + openclaw doctor.

Шаг 5 — три полосы на Mac

Stable, если квантуется MLX — днём локально на Metal; spiker — сначала remote Mac regression; тяжёлое — Dollar-track (см. двойной рейтинг). Ноутбук 36 GB — под ревью, не под экспериментальный flood.

Шаг 6 — недельный разбор

$/1M, P95, статус preview; declining выкинуть из default chain.

7. Матрица трёх полос

СценарийTop ModelsTrendingКонтур
Cursor completion✅ stable дешёвый❌ не defaultЛокальный MLX/Metal или OpenRouter
OpenClaw 7×24✅ primary⚠️ только хвост fallbackRemote Mac Gateway (launchd)
Проба модели✅ grayRemote Mac sandbox
Free preview❌ не долгий default✅ time-boxМиграция в день X

8. Кейс: погоня за Trending → stable + gray

«Команда из 8 Mac поставила Qwen 3.6 Plus Preview (Trending #2) default OpenClaw. Две недели free preview — 9,2B токенов/мес. Paid без смены конфига: $1 100 → $4 600/мес. Разбор: код должен был идти по Programming DeepSeek V4 Flash; Preview — только 10% gray. Откат на MiMo-V2.5 + gray Preview + auto-downgrade в billing day — следующий месяц $2 050, −55%, Trending всё ещё в A/B gray.»

Trending — сигнал, не прод-default. Ортогонально двойному рейтингу: деньги vs время.

9. Рынок ускоряется; Mac — контрольная стойка Metal

При 25T+ токенов/нед циклы моделей короче релизов «обычного» софта. Stealth и free-preview всплески — норма. Ценность Apple Silicon: offline baseline stable через MLX/Ollama на Metal; кандидаты Trending — Agent-regression на удалённом Mac, Cursor на ноутбуке — steady-state, 36 GB unified memory не под эксперимент. Linux/Windows тоже дергают OpenRouter, но launchd Gateway 24/7, параллель Xcode/FCP, Metal sidecar inference на macOS проще стыковать. Удалённые узлы MACGPU физически режут gray Trending от прода; ноут — ревью и Dollar-fallback.

10. Цифры и чеклист приёмки

(1) Токены/нед: ~25T (Series B), снимок ~31,34T. (2) Китайские модели: 60%+ токенов. (3) Всплески: Gemini 3.1 Flash Lite +15% WoW; Qwen 3.6 Plus новый Top 5. (4) Preview→paid: $4 600 → $2 050 (−55%).

Чеклист: Top Models top‑5 □ | Trending top‑5 □ | срез = workload □ | Trending gray ≤10% □ | календарь preview □ | fallback хвост снимается одной командой □ | remote Mac 50 prompts □ | Metal/MLX P95 в бюджете □

В: Trending + двойной рейтинг? Двойной — объём vs деньги; Trending — пробовать ли на этой неделе. В: Programming для IDE? Да, обязательно. В: MACGPU? Remote — gray и steady Agent; ноут — MLX baseline на Metal и дорогой fallback.