2026 OPENROUTER
BILLING_
BEATS_
BENCHMARKS.

OpenRouter 週 Token 調用量排行與帳單數據

MMLU 榜首換了一茬又一茬,但 OpenRouter 上週(5 月 18–24 日)真實結算的 28.9 兆 Token 不會說謊:DeepSeek-V4-Flash3.43T 奪冠,中國模型週調用 9.22 兆 連續四週壓過美國。痛點:開發者被廠商 Benchmark 帶節奏,帳單卻在為「低價高吞吐」模型投票。結論:Token 調用量是 AI 商業化的體溫計;Anthropic 占約 12% 流量卻攬 46% 美元收入,揭示「評測榜 vs 市場榜」的反轉。結構預告:資料來源 → 全球總量 → Top 10 → 廠商雙重真相 → a16z 反直覺發現 → 五步路由 → 案例 → Mac 分流。

1. 痛點拆解:為什麼帳單比 Benchmark 更可信

1)基準測試可刷、調用量難刷:排行榜可以針對評測集調參,但每週向 OpenRouter 路由的兆級 Token 代表真實生產負載——誰便宜、誰穩、誰適合 Agent,使用者會用錢包投票。2)「最強」≠「最被用」:Claude Opus 在複雜推理上仍是標竿,但週 Token 量可能只有 DeepSeek Flash 的零頭;企業為品質付溢價,大眾為吞吐付流量。3)中美格局已翻轉:2025 年初中國模型在 OpenRouter 流量占比不足 2%,2026 年 5 月已超 45%——若路由表仍只有 GPT/Claude 預設鏈,成本結構已落後於市場。4)程式設計已成最大單一用途:OpenRouter × a16z 聯合報告顯示,程式設計類任務 Token 占比從 2025 年初約 11% 飆升至超 50%——選型必須按場景拆鏈,不能押寶單一「全能王」。

2. 資料來源與統計方法

本文核心資料來自 openrouter.ai/rankings 公開排行榜,統計口徑為按週(7 天滾動)Token 吞吐量,包含輸入與輸出。OpenRouter 作為全球最大中立 AI 模型 API 聚合平台,接入 300+ 模型、覆蓋 60+ 供應商,月處理量約 100 兆 Token 量級,超 800 萬 使用者——其週榜可視為「多廠商、多場景、多地區」的抽樣全景。主快照週期:2026 年 5 月 18 日–5 月 24 日;6 月初平台週總量已進一步升至約 33T+(第三方追蹤),趨勢與 5 月末一致。交叉引用:每日經濟新聞 2026-05-25、OpenRouter × a16z《2025 AI 使用報告》、Digital Applied 6 月解讀。

3. 全球週總量:28.9 兆 Token,連續五週上漲

指標資料環比解讀
全球週調用量28.9 兆 Token+7.4%連續五週上漲,AI 推理進入規模化爆發
中國模型週調用9.223 兆+19.89%增速高於全球均值
美國模型週調用4.93 兆+16.27%仍增長,但份額被擠壓
中美對比中國 > 美國連續四週中國模型穩居全球週調用首位
一年量級變化約 2.4T → 28.9T約 12×一年前週處理量僅為今日零頭

數量級感知:若把 28.9 兆 Token 粗算為「全球開發者一週向模型發出的工作量」,其規模已超過任何單一廠商發表會上的 demo 流量總和——這是商業化落地的硬指標,而非實驗室分數。

4. 當週 Top 10 模型調用量排行

排名模型廠商週 Token環比特點
1DeepSeek-V4-FlashDeepSeek(中國)3.43T+66%Agent 工作流首選,極低價格
2騰訊 Hy3 PreviewTencent(中國)3.07T+16%限免結束後仍高增長
3Claude Sonnet 4.6Anthropic(美國)1.35T百萬上下文,企業程式設計主力
4DeepSeek-V3.2DeepSeek(中國)1.31T低價長尾,角色扮演活躍
5Owl AlphaOpenRouter1.15T+29%免費 Agent 特化,百萬上下文
6Gemini 3 Flash PreviewGoogle(美國)1.06T多模態,學術/醫療場景
7DeepSeek-V4-ProDeepSeek(中國)1.00T矩陣旗艦(系列合計約 5.74T)
8MiniMax M2.7MiniMax(中國)806B長上下文性價比
9Grok 4.1 FastxAI(美國)721B2M 上下文,法律場景
10Step 3.5 FlashStepFun(中國)673B快速低價,批次處理

DeepSeek 多模型矩陣稱霸:V4-Flash、V4-Pro、V3.2 三款同時進入前十,系列週調用合計約 5.74 兆(環比 +25.9%),連續兩週在廠商維度超越 Anthropic 與 Google。Kimi K2.6 前週曾居第 6,當週跌出前十——說明週榜波動快,必須按週追蹤而非每季才改一次路由。

5. 廠商格局:Token 量 vs 美元收入的「雙重真相」

分層代表Token 特徵收入特徵典型場景
高價值·低流量Claude Opus 4.6/4.7份額下滑(約 12%)美元份額約 46%企業複雜推理、合規場景
性價比·中流量Gemini 3 Flash穩定增長中等 ARPU多模態、學術文件
極低價·高流量DeepSeek / Hy3 / MiniMax合計占平台 45%+收入占比遠低於 Token 占比Agent、程式設計、批次處理

Anthropic 溢價悖論:企業級使用者仍為 Claude 付高價(Opus 月收入可達約 2500 萬美元 量級報導),但流量主導權已讓渡給低價開源矩陣。這不是 Anthropic「輸了」,而是市場分裂為美元軌Token 軌——Mac 團隊應雙軌配置:日常 Agent 走 Token 軌,架構/安全稽核走 Dollar 軌(詳見雙軌讀法文)。

6. 反直覺發現:評測分數與市場份額的反轉

OpenRouter 與 a16z 聯合發布的《2025 AI 使用報告》覆蓋約 100 兆 Token 匿名中繼資料,核心發現令人不安:模型的基準測試分數與其實際市場份額幾乎呈反比。原因並不神秘:開發者更關心推理成本、API 延遲與工具呼叫穩定性,而非極限單點分數;Agent 工作流需要可預測的吞吐,而非偶爾刷出的 SOTA。程式設計任務占比過半進一步放大這一效應——SWE-bench 高分模型若定價 $25/M output,在日均百萬 Token 的 IDE 場景下會被 V4-Flash(約 $0.14/M 量級)迅速替代。結論:帳單上的數字,比任何評測榜單都誠實。

7. 五步落地:把週榜寫進 Mac 工作流

Step 1 — 每週一開啟 rankings,存檔 Top 10 diff

記錄名次變化與週環比 >30% 的模型;新進前十(如 Owl Alpha)往往是下一波路由熱點。

Step 2 — 按任務拆鏈,禁止「一個預設走天下」

Agent/批次處理 → DeepSeek-V4-Flash;企業複雜推理 → Claude Opus;多模態 → Gemini Flash。IDE 與 OpenClaw 分開配置。

Step 3 — 標註 Mac 三檔:本機 MLX / OpenRouter API / 遠端 Mac

7B–32B 量化穩態 → 本機;1M 上下文與實驗模型 → API;7×24 OpenClaw Gateway → 遠端 Mac launchd 常駐。

Step 4 — 設 Dollar 軌月度預算上限

Opus/GPT 僅用於架構評審;月度 Token 超預算 15% 自動降級到 V4-Flash 或 Hy3。

Step 5 — 50 prompt 週更驗收

同一套 prompt 在本機、OpenRouter、遠端 Mac 各跑一遍,對比延遲、$/M 與 tool-call 成功率。

# OpenRouter 週榜路由骨架(openclaw.json 範例) token_track: primary: openrouter/deepseek/deepseek-v4-flash fallback: [ openrouter/tencent/hy3-preview, openrouter/minimax/m2.7 ] dollar_track: primary: openrouter/anthropic/claude-opus-4.7 budget_cap_usd: 800 # 月度硬頂 gray_pool: model: openrouter/openrouter/owl-alpha max_share: 0.10 # 禁敏感資料

8. 深度案例:一家 6 人 Mac 團隊如何用週榜把月費打下來

「團隊原預設 Claude Sonnet 全場景,月 OpenRouter 約 $3,200。對照 5 月 18–24 週榜後:62% Token 切到 DeepSeek-V4-Flash(Agent + Cursor),18% Hy3 preview 灰度,12% Gemini 3 Flash 多模態,僅 8% 保留 Opus 做安全稽核。四週後帳單 $1,940(-39%),P95 工具呼叫延遲降 14%。關鍵動作:把 OpenClaw Gateway 遷到遠端 Mac M4 Max 64GB 記憶體,本機 16GB Air 不再 7×24 硬扛——統一記憶體留給 FCP 與 ComfyUI。」

案例印證大綱核心論點:不是誰最聰明,而是誰最被調用,才推動 AI 真正落地。投資者用週榜評估商業化進度(OpenRouter 估值曾達約 26× PS 量級報導);開發者用它選模型;研究機構追蹤產業趨勢——Token 調用量已從「技術指標」升級為商業戰場晴雨表

9. 可引用數字與驗收清單

① 全球週調用:28.9 兆 Token(+7.4%)。② 中國模型週調用:9.223 兆(+19.89%)。③ DeepSeek 系列合計:5.74 兆。④ Anthropic:約 12% Token / 46% 美元收入。⑤ 一年週量級增長:約 12 倍(2.4T→28.9T)。⑥ 程式設計任務 Token 占比:11%→50%+

驗收清單: 週榜 Top 10 已截圖 □ | Token/Dollar 雙軌已拆分 □ | 三檔分流已標註 □ | Dollar 軌預算上限 □ | 50 prompt 週更對照 □ | 遠端 Mac Gateway 常駐 □ | 免費模型禁敏感資料 □

純 Windows/Linux 或雲端主機同樣能接 OpenRouter,但在與 Xcode、Final Cut、ComfyUI 並行、launchd 常駐 OpenClaw、Metal 側車 MLX 驗證的一體化工作流上,macOS 仍更順暢。若你希望「本機穩態推理」與「週榜實驗模型 + 兆級 Agent API」物理隔離,避免 16GB 筆電被 Gateway 占滿統一記憶體,MACGPU 遠端 Mac 節點可專跑 OpenClaw 與灰度路由,本機只保留 Cursor 審閱與 Dollar 軌——用租賃算力換可預測的月費與溫控。