2026 OPENROUTER
TEN_DIM_
WEEKLY_
SNAPSHOT.

OpenRouter 十维排行榜周快照与 Mac 路由

打开 openrouter.ai/rankings,很多人只扫一眼 Top Models #1 就改 Cursor 默认模型——但 6 月初的真实用量早已「分榜化」:总榜可能是 MiMo-V2.5-Pro,而 Programming Collections(2026 年 6 月更新)里领跑的却是 DeepSeek V4 FlashTencent Hy3 preview。平台周 token 已公开报道至 25T–31T+,中文厂商合计 token 约 60%+。本文给 Mac 开发者一张整页十维周快照读法:何时跟 Top Models、何时跟 Collections/分榜、如何用周更清单改 OpenClaw / Cursor 路由。结论:把 rankings 当路由配置表,按任务类型打开对应维度,禁止用总榜第一名覆盖编程与 Agent 专用链。 下文含痛点 — 十维速查 — 6 月 Programming 错位 — 六步落地 — 矩阵 — 案例 — 验收清单。

1. 痛点拆解:只看总榜第一名的四种翻车

1)IDE 跟错榜:Cursor 默认写成总榜 #1,实际编程流量在 Programming 分榜,补全质量与成本双输。2)Collections 与 Leaderboard 混读:Collections 按场景策展(编程/Agent),主榜按全站 token;Hy3 preview 在编程合集靠前,但总榜可能前十开外。3)忽略 Provider 层:SiliconFlow 等中转周 token 可达 4T+ 但收入占比 <2%(见双轨文),只改 model id 不改 provider 仍会漂移。4)不做周更 diff:6 月榜单迭代快于发版周期,openclaw.json 写死上月模型,预览结束账单暴涨(Trending 文已讲时间维,本文补「整页对齐」)。

2. 十维面板速查:各回答什么问题

维度(rankings 页)度量Mac 用途
Top Models / LLM Leaderboard本周全站 tokenOpenClaw 默认、通用 Agent
Market Share按模型作者份额供应商集中度、合规
Languages按自然语言中英产品分设默认
Programming按编程语言(如 Python)Cursor / Cline / Continue
Context Length按 prompt 长度分桶RAG 长文档路由
Tool Calls工具调用流量OpenClaw / Hermes 栈
Images / Image Output多模态输入/出图视觉 Agent vs ComfyUI
Audio Input语音输入 token播客/会议 STT API
Trending周环比涨幅灰度池(非生产默认)
Programming Collections场景策展 + 6 月用量IDE 专用首选表

3. 6 月初平台量级:31T 周 token 与 60% 中文占比怎么读

第三方对 OpenRouter 公开 endpoint 的 5 月底–6 月初快照约 31.34T tokens/周;官方 Series B 材料常引 ~25T/周。二者差异来自统计窗口与是否含全量路由——运维自用相对排名与周环比即可。中文系(Xiaomi、Alibaba、DeepSeek、MiniMax、Moonshot 等)合计 token 多家分析报 60%+,不等于「全球 API 份额」,而是经 OpenRouter 的开发者在选性价比。Mac 团队应把这一结构翻译成:默认链优先低价开源/预览线,Dollar 轨保留 Claude Opus / GPT-5.5 作难任务兜底。

4. Programming Collections vs Top Models:6 月错位案例

OpenRouter 在 2026 年 6 月 更新了 Programming 合集说明:排名依据「经 OpenRouter 的编程场景真实用量」。公开报道与合集页面可见的领跑组包括:

  • DeepSeek V4 Flash:MoE 284B/13B 激活、1M context,偏高速编程与吞吐;
  • Tencent Hy3 preview:编程合集高位,适合 IDE 灰度;
  • MiMo-V2.5-Pro / DeepSeek V4 Pro:总榜稳态与编程榜常同时出现;
  • Claude Opus/Sonnet 4.6–4.7:token 量未必第一,但 Dollar 轨与复杂重构仍常用。

错位规则:若 Top Models #1 ≠ Programming 榜 #1,Cursor 应以 Programming + Collections 为准;OpenClaw 仍以 Top Models + Tool Calls 为准。勿用一篇总榜文章覆盖 IDE 与 Agent 两套配置。

5. 六步周更落地(周一 30 分钟)

Step 1 — 截「十维一页纸」

记录 Top Models 前五、Programming 前五、Tool Calls 前三、Market Share 中文合计占比。

Step 2 — 打开 Collections 对照

访问 programming 合集,标出与主榜差 >5 名的模型(如 Hy3 preview)。

Step 3 — 改 Cursor 路由

编程默认 → Programming 榜 #1–#2;难 bug → Dollar 轨 Sonnet/Opus。

Step 4 — 改 OpenClaw fallback

主模型跟 Top Models;Tool Calls 榜前三进 fallback;Collections 新模型仅末位灰度。

Step 5 — Provider 与预览日历

锁定 provider slug;免费预览设结束日,当日跑 openclaw doctor

Step 6 — Mac 三档分流验收

稳态可 MLX 量化 → 本机;实验模型 → 远程 Mac 对照;难任务 → API Dollar 轨。

周一 diff 模板(粘贴到 Notion/飞书) ├─ 周 token 总量: ___T(环比 ___%) ├─ Top Models #1–3: ___ ├─ Programming #1–3: ___(与总榜差: 是/否) ├─ Tool Calls #1–2: ___ ├─ 中文 Market Share: ___% └─ 本周灰度模型(≤10%): ___

6. 三档决策矩阵

任务跟哪张表Mac 路径
Cursor 日常补全Programming + Collections本机 MLX 小模型 或 OpenRouter 低价线
OpenClaw 7×24Top Models + Tool Calls远程 Mac Gateway 常驻
长文档 RAGContext Length >32K 桶本机 64GB+ 或远程 Mac MLX
出图素材Image OutputComfyUI 本机 + API 兜底
架构/安全评审不看 token 榜Dollar 轨 Claude/GPT

7. 深度案例:总榜第一写进 Cursor 后编程账单 +38%

「6 人 Mac 团队把 MiMo-V2.5-Pro(Top Models #1)设为 Cursor 与 OpenClaw 统一默认。两周后编程 token 占比 71%,但 SWE 类任务 P95 延迟上升 22%——对照 Programming 榜才发现 IDE 流量应跟 DeepSeek V4 Flash。拆分后:Cursor → V4 Flash + Hy3 灰度 8%;OpenClaw → MiMo 主模型 + Tool Calls 榜 Hermes 线。月费从 $3,400 降至 $2,108(-38%),P95 降 19%。」

案例说明:总榜衡量「全网最热」,Collections/Programming 衡量「场景最合适」。与 Trending、双轨文互补,不重复展开。

8. 行业洞察:rankings 将变成「每周路由 PR」

当平台周吞吐达 31T 级,模型上架周期已短于传统软件发版。OpenRouter 的 rankings + collections 组合,实质是多租户路由器的公开 telemetry。Mac 团队的优势在于:用 Apple Silicon 本机对稳态模型做 MLX 对照,用远程 Mac 跑 Collections 新模型回归,笔记本不被实验流量占满统一内存。纯 Windows 或 Linux 也能接 OpenRouter,但在 launchd 常驻 Gateway、与 Xcode/FCP/ComfyUI 并行、Metal 侧车推理 上,macOS 仍更顺滑。若你希望「总榜稳态」与「编程榜实验」物理隔离,MACGPU 远程 Mac 节点 可专跑 OpenClaw 与 IDE 灰度,本机只保留审阅与 Dollar 轨。

9. 可引用数字与验收清单

① 周 token(第三方快照):~31.34T;官方口径 ~25T。② 中文系 token 份额:60%+(多家分析)。③ Programming 领跑(6 月合集):DeepSeek V4 Flash、Hy3 preview。④ 案例拆分路由后:$3,400 → $2,108(-38%)

验收清单: 十维面板已截图 □ | Programming vs Top Models 差异常已记录 □ | Cursor 已按 Programming 改默认 □ | OpenClaw 已按 Tool Calls 校 fallback □ | Provider slug 已锁定 □ | 预览结束日历 □ | 远程 Mac 50 prompt 对照 □

问:还和 Trending 榜冲突吗?答:不冲突——Trending 管「本周试不试」,本文管「整页该看哪一格」。问:编程分榜还要单独读吗?答:要,且须对照 Collections 6 月更新。