2026 OPENROUTER
TRENDING_
VS_
TOP_
MODELS.
На openrouter.ai/rankings This Week (Top Models) — кто съел больше всего токенов за неделю; Trending — кто вырос быстрее всех (WoW). Это часто разные семейства. Серия за май: общий рейтинг, Programming, Tool Calls и др.; двойной рейтинг начала июня — токены vs выручка. Здесь — временная ось: ~25T токенов/нед (Series B), снимки ~31,34T, Gemini 3.1 Flash Lite +15% WoW против steady-state гигантов вроде MiMo-V2.5, и как развести потоки на Mac Cursor / OpenClaw без убийства unified memory и Metal-throughput. Вердикт: прод — Top Models + нужный срез; Trending — только gray pool + runbook конца preview. Дальше: 8 рейтингов — 3 архетипа — 6 шагов — матрица — кейс — чеклист.
1. Пять способов, как Trending ломает прод
(1) +15% WoW ≠ «модель сильнее везде»: всплески Flash/Lite — цена, free-preview, заливка Agent-трафиком, не SWE-bench. (2) Смотреть только #1 Top Models: MiMo-V2.5 — нормальный default Agent; Qwen 3.6 Plus Preview после биллинга может потерять половину throughput. (3) 8 рейтингов в вакууме: Programming #1 + Images #1 в одном fallback — тихая деградация мультимодала. (4) Не сменили route после preview: старый model id в OpenClaw — счёт ×2 за ночь. (5) В прод без приёмки на Mac: влезает ли Trending-модель в 36 GB unified memory под MLX — решает, вернёте ли spike на Metal или оставите на API/remote.
2. Восемь срезов rankings: метрика и Mac-контур
| Срез | Что меряет | Mac-маршрут |
|---|---|---|
| Top Models | Суммарные недельные токены | Прод-default, OpenClaw primary |
| Trending | Макс. WoW-рост | Gray pool, A/B, time-boxed fallback |
| Market Share | Доля вендора | Концентрация, compliance |
| Languages | По языку | Разные default RU/EN/ZH |
| Programming | По языку кода | Cursor / Cline |
| Context Length | Длина prompt | Long RAG vs короткий чат |
| Tool Calls | Объём tool calls | Agent / OpenClaw stack |
| Images / Image Output / Audio | Мультимодал | Vision Agent, ComfyUI+Metal vs API |
Правило связки: зафиксировать тип нагрузки → открыть срез; Trending в gray только если модель в Top 10 этого же среза — иначе один всплеск отравит глобальный default.
3. Масштаб платформы: 25T–31,34T/нед — что это для throughput
Series B: ~25T токенов/нед (~×5 к ~5T полгода назад); публичные endpoint-снимки конца мая ~31,34T. Следствия: (1) default Agent — еженедельный пересмотр, не раз в квартал; (2) китайские open-source — часто 60%+ токенов, дёшево, residency отдельно; (3) WoW +12%…+432% — рутина, нужен скрипт «spike diff», не ручной скролл rankings. На Mac это бьёт по пропускной способности Metal/MLX и по лимитам удалённого узла — планируйте gray так, чтобы не забить bandwidth Gateway.
4. Три архетипа: spiker / stable / declining
| Тип | Сигнал | Примеры (публично) | Mac-стратегия |
|---|---|---|---|
| Spiker | Trending вверху, WoW двузначный+ | Gemini 3.1 Flash Lite (+15%), Qwen 3.6 Plus Preview (новый Top 5) | 5–10% gray; календарь конца preview |
| Stable | Top Models #1–#3 долго | MiMo-V2-Pro/V2.5, DeepSeek V4, MiniMax M2.7 | Прод + MLX size-check на Metal |
| Declining | Доля в Top 10 падает | Часть GPT-5.x (~-8% относительной доли) | Dollar-track fallback, не Agent-default |
5. Дерево решений (компакт)
6. Шесть шагов: rankings → openclaw.json / Cursor
Шаг 1 — снимок в понедельник
Top 5 Top Models + Top 5 Trending, пометить WoW%.
Шаг 2 — срез = workload
Код → Programming; Agent → Tool Calls; общий рейтинг не заменяет срез.
Шаг 3 — Trending в gray
В конец fallback; не больше 10% сессий.
Шаг 4 — runbook конца preview
Календарь; в день смены цены — model id + openclaw doctor.
Шаг 5 — три полосы на Mac
Stable, если квантуется MLX — днём локально на Metal; spiker — сначала remote Mac regression; тяжёлое — Dollar-track (см. двойной рейтинг). Ноутбук 36 GB — под ревью, не под экспериментальный flood.
Шаг 6 — недельный разбор
$/1M, P95, статус preview; declining выкинуть из default chain.
7. Матрица трёх полос
| Сценарий | Top Models | Trending | Контур |
|---|---|---|---|
| Cursor completion | ✅ stable дешёвый | ❌ не default | Локальный MLX/Metal или OpenRouter |
| OpenClaw 7×24 | ✅ primary | ⚠️ только хвост fallback | Remote Mac Gateway (launchd) |
| Проба модели | ❌ | ✅ gray | Remote Mac sandbox |
| Free preview | ❌ не долгий default | ✅ time-box | Миграция в день X |
8. Кейс: погоня за Trending → stable + gray
«Команда из 8 Mac поставила Qwen 3.6 Plus Preview (Trending #2) default OpenClaw. Две недели free preview — 9,2B токенов/мес. Paid без смены конфига: $1 100 → $4 600/мес. Разбор: код должен был идти по Programming DeepSeek V4 Flash; Preview — только 10% gray. Откат на MiMo-V2.5 + gray Preview + auto-downgrade в billing day — следующий месяц $2 050, −55%, Trending всё ещё в A/B gray.»
Trending — сигнал, не прод-default. Ортогонально двойному рейтингу: деньги vs время.
9. Рынок ускоряется; Mac — контрольная стойка Metal
При 25T+ токенов/нед циклы моделей короче релизов «обычного» софта. Stealth и free-preview всплески — норма. Ценность Apple Silicon: offline baseline stable через MLX/Ollama на Metal; кандидаты Trending — Agent-regression на удалённом Mac, Cursor на ноутбуке — steady-state, 36 GB unified memory не под эксперимент. Linux/Windows тоже дергают OpenRouter, но launchd Gateway 24/7, параллель Xcode/FCP, Metal sidecar inference на macOS проще стыковать. Удалённые узлы MACGPU физически режут gray Trending от прода; ноут — ревью и Dollar-fallback.
10. Цифры и чеклист приёмки
(1) Токены/нед: ~25T (Series B), снимок ~31,34T. (2) Китайские модели: 60%+ токенов. (3) Всплески: Gemini 3.1 Flash Lite +15% WoW; Qwen 3.6 Plus новый Top 5. (4) Preview→paid: $4 600 → $2 050 (−55%).
Чеклист: Top Models top‑5 □ | Trending top‑5 □ | срез = workload □ | Trending gray ≤10% □ | календарь preview □ | fallback хвост снимается одной командой □ | remote Mac 50 prompts □ | Metal/MLX P95 в бюджете □
В: Trending + двойной рейтинг? Двойной — объём vs деньги; Trending — пробовать ли на этой неделе. В: Programming для IDE? Да, обязательно. В: MACGPU? Remote — gray и steady Agent; ноут — MLX baseline на Metal и дорогой fallback.