2026 年 6 月初 OpenRouter 排行榜整頁十維週快照：Programming Collections 與 Top Models 錯位時 Mac 該跟哪張表

開啟 openrouter.ai/rankings，許多人只掃一眼 Top Models #1 就改 Cursor 預設模型——但 6 月初的真實用量早已「分榜化」：總榜可能是 MiMo-V2.5-Pro，而 Programming Collections（2026 年 6 月更新）裡領跑的是 DeepSeek V4 Flash 與 Tencent Hy3 preview。平台週 token 已公開報導至 25T–31T+，中文廠商合計 token 約 60%+。本文給 Mac 開發者一張整頁十維週快照讀法：何時跟 Top Models、何時跟 Collections/分榜、如何用週更清單改 OpenClaw / Cursor 路由。結論：把 rankings 當路由設定表，按任務類型開啟對應維度，禁止用總榜第一名覆蓋程式設計與 Agent 專用鏈。 下文含痛點 — 十維速查 — 6 月 Programming 錯位 — 六步落地 — 矩陣 — 案例 — 驗收清單。

1. 痛點拆解：只看總榜第一名的四種翻車

1）IDE 跟錯榜：Cursor 預設寫成總榜 #1，實際程式設計流量在 Programming 分榜，補全品質與成本雙輸。2）Collections 與 Leaderboard 混讀：Collections 按場景策展（程式設計/Agent），主榜按全站 token；Hy3 preview 在程式設計合集靠前，但總榜可能前十開外。3）忽略 Provider 層：SiliconFlow 等中轉週 token 可達 4T+ 但收入占比 <2%（見雙軌文），只改 model id 不改 provider 仍會漂移。4）不做週更 diff：6 月榜單迭代快於發版週期，openclaw.json 寫死上月模型，預覽結束帳單暴漲（Trending 文已講時間維，本文補「整頁對齊」）。

2. 十維面板速查：各回答什麼問題

維度（rankings 頁）	度量	Mac 用途
Top Models / LLM Leaderboard	本週全站 token	OpenClaw 預設、通用 Agent
Market Share	按模型作者份額	供應商集中度、合規
Languages	按自然語言	中英產品分設預設
Programming	按程式語言（如 Python）	Cursor / Cline / Continue
Context Length	按 prompt 長度分桶	RAG 長文件路由
Tool Calls	工具呼叫流量	OpenClaw / Hermes 棧
Images / Image Output	多模態輸入/出圖	視覺 Agent vs ComfyUI
Audio Input	語音輸入 token	播客/會議 STT API
Trending	週環比漲幅	灰度池（非生產預設）
Programming Collections	場景策展 + 6 月用量	IDE 專用首選表

3. 6 月初平台量級：31T 週 token 與 60% 中文占比怎麼讀

第三方對 OpenRouter 公開 endpoint 的 5 月底–6 月初快照約 31.34T tokens/週；官方 Series B 材料常引 ~25T/週。二者差異來自統計窗口與是否含全量路由——維運自用相對排名與週環比即可。中文系（Xiaomi、Alibaba、DeepSeek、MiniMax、Moonshot 等）合計 token 多家分析報 60%+，不等於「全球 API 份額」，而是經 OpenRouter 的開發者在選性價比。Mac 團隊應把這一結構翻譯成：預設鏈優先低價開源/預覽線，Dollar 軌保留 Claude Opus / GPT-5.5 作難任務兜底。遠端 Mac 伺服器的頻寬與記憶體規劃也要跟著週複審，避免灰度流量把 Gateway 打滿。

4. Programming Collections vs Top Models：6 月錯位案例

OpenRouter 在 2026 年 6 月 更新了 Programming 合集說明：排名依據「經 OpenRouter 的程式設計場景真實用量」。公開報導與合集頁面可見的領跑組包括：

DeepSeek V4 Flash：MoE 284B/13B 激活、1M context，偏高速程式設計與吞吐；
Tencent Hy3 preview：程式設計合集高位，適合 IDE 灰度；
MiMo-V2.5-Pro / DeepSeek V4 Pro：總榜穩態與程式設計榜常同時出現；
Claude Opus/Sonnet 4.6–4.7：token 量未必第一，但 Dollar 軌與複雜重構仍常用。

錯位規則：若 Top Models #1 ≠ Programming 榜 #1，Cursor 應以 Programming + Collections 為準；OpenClaw 仍以 Top Models + Tool Calls 為準。勿用一篇總榜文章覆蓋 IDE 與 Agent 兩套設定。詳細程式設計分榜拆解可參考5 月底程式設計分榜文。

5. 六步週更落地（週一 30 分鐘）

Step 1 — 截「十維一頁紙」

記錄 Top Models 前五、Programming 前五、Tool Calls 前三、Market Share 中文合計占比。

Step 2 — 打開 Collections 對照

造訪 programming 合集，標出與主榜差 >5 名的模型（如 Hy3 preview）。

Step 3 — 改 Cursor 路由

程式設計預設 → Programming 榜 #1–#2；難 bug → Dollar 軌 Sonnet/Opus。

Step 4 — 改 OpenClaw fallback

主模型跟 Top Models；Tool Calls 榜前三進 fallback；Collections 新模型僅末位灰度。

Step 5 — Provider 與預覽日曆

鎖定 provider slug；免費預覽設結束日，當日跑 openclaw doctor。

Step 6 — Mac 三檔分流驗收

穩態可 MLX 量化 → 本機；實驗模型 → 遠端 Mac 對照；難任務 → API Dollar 軌。

週一 diff 模板（貼到 Notion/飛書）
├─ 週 token 總量: ___T（環比 ___%）
├─ Top Models #1–3: ___
├─ Programming #1–3: ___（與總榜差: 是/否）
├─ Tool Calls #1–2: ___
├─ 中文 Market Share: ___%
└─ 本週灰度模型（≤10%）: ___
                

6. 三檔決策矩陣

任務	跟哪張表	Mac 路徑
Cursor 日常補全	Programming + Collections	本機 MLX 小模型或 OpenRouter 低價線
OpenClaw 7×24	Top Models + Tool Calls	遠端 Mac Gateway 常駐
長文件 RAG	Context Length >32K 桶	本機 64GB+ 統一記憶體或遠端 Mac MLX
出圖素材	Image Output	ComfyUI 本機 + API 兜底
架構/安全評審	不看 token 榜	Dollar 軌 Claude/GPT

7. 深度案例：總榜第一寫進 Cursor 後程式設計帳單 +38%

「6 人 Mac 團隊把 MiMo-V2.5-Pro（Top Models #1）設為 Cursor 與 OpenClaw 統一預設。兩週後程式設計 token 占比 71%，但 SWE 類任務 P95 延遲上升 22%——對照 Programming 榜才發現 IDE 流量應跟 DeepSeek V4 Flash。拆分後：Cursor → V4 Flash + Hy3 灰度 8%；OpenClaw → MiMo 主模型 + Tool Calls 榜 Hermes 線。月費從 $3,400 降至 $2,108（-38%），P95 降 19%。遠端 Mac 伺服器專跑 OpenClaw 與灰度，本機 36GB 統一記憶體留給審閱與 Dollar 軌。」

案例說明：總榜衡量「全網最熱」，Collections/Programming 衡量「場景最合適」。與 Trending、雙軌文互補，不重複展開。關鍵教訓是：同一個 model id 不該同時扛 IDE 補全與 7×24 Agent——兩條鏈的榜單依據不同，硬合併只會在延遲、成本與穩定性上三輸。

8. 行業洞察：rankings 將變成「每週路由 PR」

當平台週吞吐達 31T 級，模型上架週期已短於傳統軟體發版。OpenRouter 的 rankings + collections 組合，實質是多租戶路由器的公開 telemetry。Mac 團隊的優勢在於：用 Apple Silicon 本機對穩態模型做 MLX 對照，用遠端 Mac 跑 Collections 新模型回歸，筆電不被實驗流量佔滿統一記憶體與上行頻寬。純 Windows 或 Linux 也能接 OpenRouter，但在 launchd 常駐 Gateway、與 Xcode/FCP/ComfyUI 並行、Metal 側車推理 上，macOS 仍更順滑。若你希望「總榜穩態」與「程式設計榜實驗」物理隔離，MACGPU 遠端 Mac 節點 可專跑 OpenClaw 與 IDE 灰度，本機只保留審閱與 Dollar 軌，伺服器頻寬留給 7×24 Agent 而不與本機素材同步搶占。

9. 可引用數字與驗收清單

① 週 token（第三方快照）：~31.34T；官方口徑 ~25T。② 中文系 token 份額：60%+（多家分析）。③ Programming 領跑（6 月合集）：DeepSeek V4 Flash、Hy3 preview。④ 案例拆分路由後：$3,400 → $2,108（-38%）。

問：還和 Trending 榜衝突嗎？答：不衝突——Trending 管「本週試不試」，本文管「整頁該看哪一格」。問：程式設計分榜還要單獨讀嗎？答：要，且須對照 Collections 6 月更新。