2026 OPENROUTER
TEN_DIM_
WEEKLY_
SNAPSHOT.

OpenRouter 十維排行榜週快照與 Mac 路由

開啟 openrouter.ai/rankings,許多人只掃一眼 Top Models #1 就改 Cursor 預設模型——但 6 月初的真實用量早已「分榜化」:總榜可能是 MiMo-V2.5-Pro,而 Programming Collections(2026 年 6 月更新)裡領跑的是 DeepSeek V4 FlashTencent Hy3 preview。平台週 token 已公開報導至 25T–31T+,中文廠商合計 token 約 60%+。本文給 Mac 開發者一張整頁十維週快照讀法:何時跟 Top Models、何時跟 Collections/分榜、如何用週更清單改 OpenClaw / Cursor 路由。結論:把 rankings 當路由設定表,按任務類型開啟對應維度,禁止用總榜第一名覆蓋程式設計與 Agent 專用鏈。 下文含痛點 — 十維速查 — 6 月 Programming 錯位 — 六步落地 — 矩陣 — 案例 — 驗收清單。

1. 痛點拆解:只看總榜第一名的四種翻車

1)IDE 跟錯榜:Cursor 預設寫成總榜 #1,實際程式設計流量在 Programming 分榜,補全品質與成本雙輸。2)Collections 與 Leaderboard 混讀:Collections 按場景策展(程式設計/Agent),主榜按全站 token;Hy3 preview 在程式設計合集靠前,但總榜可能前十開外。3)忽略 Provider 層:SiliconFlow 等中轉週 token 可達 4T+ 但收入占比 <2%(見雙軌文),只改 model id 不改 provider 仍會漂移。4)不做週更 diff:6 月榜單迭代快於發版週期,openclaw.json 寫死上月模型,預覽結束帳單暴漲(Trending 文已講時間維,本文補「整頁對齊」)。

2. 十維面板速查:各回答什麼問題

維度(rankings 頁)度量Mac 用途
Top Models / LLM Leaderboard本週全站 tokenOpenClaw 預設、通用 Agent
Market Share按模型作者份額供應商集中度、合規
Languages按自然語言中英產品分設預設
Programming按程式語言(如 Python)Cursor / Cline / Continue
Context Length按 prompt 長度分桶RAG 長文件路由
Tool Calls工具呼叫流量OpenClaw / Hermes 棧
Images / Image Output多模態輸入/出圖視覺 Agent vs ComfyUI
Audio Input語音輸入 token播客/會議 STT API
Trending週環比漲幅灰度池(非生產預設)
Programming Collections場景策展 + 6 月用量IDE 專用首選表

3. 6 月初平台量級:31T 週 token 與 60% 中文占比怎麼讀

第三方對 OpenRouter 公開 endpoint 的 5 月底–6 月初快照約 31.34T tokens/週;官方 Series B 材料常引 ~25T/週。二者差異來自統計窗口與是否含全量路由——維運自用相對排名與週環比即可。中文系(Xiaomi、Alibaba、DeepSeek、MiniMax、Moonshot 等)合計 token 多家分析報 60%+,不等於「全球 API 份額」,而是經 OpenRouter 的開發者在選性價比。Mac 團隊應把這一結構翻譯成:預設鏈優先低價開源/預覽線,Dollar 軌保留 Claude Opus / GPT-5.5 作難任務兜底。遠端 Mac 伺服器的頻寬與記憶體規劃也要跟著週複審,避免灰度流量把 Gateway 打滿。

4. Programming Collections vs Top Models:6 月錯位案例

OpenRouter 在 2026 年 6 月 更新了 Programming 合集說明:排名依據「經 OpenRouter 的程式設計場景真實用量」。公開報導與合集頁面可見的領跑組包括:

  • DeepSeek V4 Flash:MoE 284B/13B 激活、1M context,偏高速程式設計與吞吐;
  • Tencent Hy3 preview:程式設計合集高位,適合 IDE 灰度;
  • MiMo-V2.5-Pro / DeepSeek V4 Pro:總榜穩態與程式設計榜常同時出現;
  • Claude Opus/Sonnet 4.6–4.7:token 量未必第一,但 Dollar 軌與複雜重構仍常用。

錯位規則:若 Top Models #1 ≠ Programming 榜 #1,Cursor 應以 Programming + Collections 為準;OpenClaw 仍以 Top Models + Tool Calls 為準。勿用一篇總榜文章覆蓋 IDE 與 Agent 兩套設定。詳細程式設計分榜拆解可參考5 月底程式設計分榜文

5. 六步週更落地(週一 30 分鐘)

Step 1 — 截「十維一頁紙」

記錄 Top Models 前五、Programming 前五、Tool Calls 前三、Market Share 中文合計占比。

Step 2 — 打開 Collections 對照

造訪 programming 合集,標出與主榜差 >5 名的模型(如 Hy3 preview)。

Step 3 — 改 Cursor 路由

程式設計預設 → Programming 榜 #1–#2;難 bug → Dollar 軌 Sonnet/Opus。

Step 4 — 改 OpenClaw fallback

主模型跟 Top Models;Tool Calls 榜前三進 fallback;Collections 新模型僅末位灰度。

Step 5 — Provider 與預覽日曆

鎖定 provider slug;免費預覽設結束日,當日跑 openclaw doctor

Step 6 — Mac 三檔分流驗收

穩態可 MLX 量化 → 本機;實驗模型 → 遠端 Mac 對照;難任務 → API Dollar 軌。

週一 diff 模板(貼到 Notion/飛書) ├─ 週 token 總量: ___T(環比 ___%) ├─ Top Models #1–3: ___ ├─ Programming #1–3: ___(與總榜差: 是/否) ├─ Tool Calls #1–2: ___ ├─ 中文 Market Share: ___% └─ 本週灰度模型(≤10%): ___

6. 三檔決策矩陣

任務跟哪張表Mac 路徑
Cursor 日常補全Programming + Collections本機 MLX 小模型 或 OpenRouter 低價線
OpenClaw 7×24Top Models + Tool Calls遠端 Mac Gateway 常駐
長文件 RAGContext Length >32K 桶本機 64GB+ 統一記憶體 或遠端 Mac MLX
出圖素材Image OutputComfyUI 本機 + API 兜底
架構/安全評審不看 token 榜Dollar 軌 Claude/GPT

7. 深度案例:總榜第一寫進 Cursor 後程式設計帳單 +38%

「6 人 Mac 團隊把 MiMo-V2.5-Pro(Top Models #1)設為 Cursor 與 OpenClaw 統一預設。兩週後程式設計 token 占比 71%,但 SWE 類任務 P95 延遲上升 22%——對照 Programming 榜才發現 IDE 流量應跟 DeepSeek V4 Flash。拆分後:Cursor → V4 Flash + Hy3 灰度 8%;OpenClaw → MiMo 主模型 + Tool Calls 榜 Hermes 線。月費從 $3,400 降至 $2,108(-38%),P95 降 19%。遠端 Mac 伺服器專跑 OpenClaw 與灰度,本機 36GB 統一記憶體留給審閱與 Dollar 軌。」

案例說明:總榜衡量「全網最熱」,Collections/Programming 衡量「場景最合適」。與 Trending、雙軌文互補,不重複展開。關鍵教訓是:同一個 model id 不該同時扛 IDE 補全與 7×24 Agent——兩條鏈的榜單依據不同,硬合併只會在延遲、成本與穩定性上三輸。

8. 行業洞察:rankings 將變成「每週路由 PR」

當平台週吞吐達 31T 級,模型上架週期已短於傳統軟體發版。OpenRouter 的 rankings + collections 組合,實質是多租戶路由器的公開 telemetry。Mac 團隊的優勢在於:用 Apple Silicon 本機對穩態模型做 MLX 對照,用遠端 Mac 跑 Collections 新模型回歸,筆電不被實驗流量佔滿統一記憶體與上行頻寬。純 Windows 或 Linux 也能接 OpenRouter,但在 launchd 常駐 Gateway、與 Xcode/FCP/ComfyUI 並行、Metal 側車推理 上,macOS 仍更順滑。若你希望「總榜穩態」與「程式設計榜實驗」物理隔離,MACGPU 遠端 Mac 節點 可專跑 OpenClaw 與 IDE 灰度,本機只保留審閱與 Dollar 軌,伺服器頻寬留給 7×24 Agent 而不與本機素材同步搶占。

9. 可引用數字與驗收清單

① 週 token(第三方快照):~31.34T;官方口徑 ~25T。② 中文系 token 份額:60%+(多家分析)。③ Programming 領跑(6 月合集):DeepSeek V4 Flash、Hy3 preview。④ 案例拆分路由後:$3,400 → $2,108(-38%)

驗收清單: 十維面板已截圖 □ | Programming vs Top Models 錯位已記錄 □ | Cursor 已按 Programming 改預設 □ | OpenClaw 已按 Tool Calls 校 fallback □ | Provider slug 已鎖定 □ | 預覽結束日曆 □ | 遠端 Mac 50 prompt 對照 □ | 伺服器記憶體/頻寬未觸頂 □

問:還和 Trending 榜衝突嗎?答:不衝突——Trending 管「本週試不試」,本文管「整頁該看哪一格」。問:程式設計分榜還要單獨讀嗎?答:要,且須對照 Collections 6 月更新。