2026 年 OpenRouter 週 Token 調用量排行：帳單數據不說謊

MMLU 榜首換了一茬又一茬，但 OpenRouter 上週（5 月 18–24 日）真實結算的 28.9 兆 Token 不會說謊：DeepSeek-V4-Flash 以 3.43T 奪冠，中國模型週調用 9.22 兆 連續四週壓過美國。痛點：開發者被廠商 Benchmark 帶節奏，帳單卻在為「低價高吞吐」模型投票。結論：Token 調用量是 AI 商業化的體溫計；Anthropic 占約 12% 流量卻攬 46% 美元收入，揭示「評測榜 vs 市場榜」的反轉。結構預告：資料來源 → 全球總量 → Top 10 → 廠商雙重真相 → a16z 反直覺發現 → 五步路由 → 案例 → Mac 分流。

1. 痛點拆解：為什麼帳單比 Benchmark 更可信

1）基準測試可刷、調用量難刷：排行榜可以針對評測集調參，但每週向 OpenRouter 路由的兆級 Token 代表真實生產負載——誰便宜、誰穩、誰適合 Agent，使用者會用錢包投票。2）「最強」≠「最被用」：Claude Opus 在複雜推理上仍是標竿，但週 Token 量可能只有 DeepSeek Flash 的零頭；企業為品質付溢價，大眾為吞吐付流量。3）中美格局已翻轉：2025 年初中國模型在 OpenRouter 流量占比不足 2%，2026 年 5 月已超 45%——若路由表仍只有 GPT/Claude 預設鏈，成本結構已落後於市場。4）程式設計已成最大單一用途：OpenRouter × a16z 聯合報告顯示，程式設計類任務 Token 占比從 2025 年初約 11% 飆升至超 50%——選型必須按場景拆鏈，不能押寶單一「全能王」。

2. 資料來源與統計方法

本文核心資料來自 openrouter.ai/rankings 公開排行榜，統計口徑為按週（7 天滾動）Token 吞吐量，包含輸入與輸出。OpenRouter 作為全球最大中立 AI 模型 API 聚合平台，接入 300+ 模型、覆蓋 60+ 供應商，月處理量約 100 兆 Token 量級，超 800 萬 使用者——其週榜可視為「多廠商、多場景、多地區」的抽樣全景。主快照週期：2026 年 5 月 18 日–5 月 24 日；6 月初平台週總量已進一步升至約 33T+（第三方追蹤），趨勢與 5 月末一致。交叉引用：每日經濟新聞 2026-05-25、OpenRouter × a16z《2025 AI 使用報告》、Digital Applied 6 月解讀。

3. 全球週總量：28.9 兆 Token，連續五週上漲

指標	資料	環比	解讀
全球週調用量	28.9 兆 Token	+7.4%	連續五週上漲，AI 推理進入規模化爆發
中國模型週調用	9.223 兆	+19.89%	增速高於全球均值
美國模型週調用	4.93 兆	+16.27%	仍增長，但份額被擠壓
中美對比	中國 > 美國	連續四週	中國模型穩居全球週調用首位
一年量級變化	約 2.4T → 28.9T	約 12×	一年前週處理量僅為今日零頭

數量級感知：若把 28.9 兆 Token 粗算為「全球開發者一週向模型發出的工作量」，其規模已超過任何單一廠商發表會上的 demo 流量總和——這是商業化落地的硬指標，而非實驗室分數。

4. 當週 Top 10 模型調用量排行

排名	模型	廠商	週 Token	環比	特點
1	DeepSeek-V4-Flash	DeepSeek（中國）	3.43T	+66%	Agent 工作流首選，極低價格
2	騰訊 Hy3 Preview	Tencent（中國）	3.07T	+16%	限免結束後仍高增長
3	Claude Sonnet 4.6	Anthropic（美國）	1.35T	—	百萬上下文，企業程式設計主力
4	DeepSeek-V3.2	DeepSeek（中國）	1.31T	—	低價長尾，角色扮演活躍
5	Owl Alpha	OpenRouter	1.15T	+29%	免費 Agent 特化，百萬上下文
6	Gemini 3 Flash Preview	Google（美國）	1.06T	—	多模態，學術/醫療場景
7	DeepSeek-V4-Pro	DeepSeek（中國）	1.00T	—	矩陣旗艦（系列合計約 5.74T）
8	MiniMax M2.7	MiniMax（中國）	806B	—	長上下文性價比
9	Grok 4.1 Fast	xAI（美國）	721B	—	2M 上下文，法律場景
10	Step 3.5 Flash	StepFun（中國）	673B	—	快速低價，批次處理

DeepSeek 多模型矩陣稱霸：V4-Flash、V4-Pro、V3.2 三款同時進入前十，系列週調用合計約 5.74 兆（環比 +25.9%），連續兩週在廠商維度超越 Anthropic 與 Google。Kimi K2.6 前週曾居第 6，當週跌出前十——說明週榜波動快，必須按週追蹤而非每季才改一次路由。

5. 廠商格局：Token 量 vs 美元收入的「雙重真相」

分層	代表	Token 特徵	收入特徵	典型場景
高價值·低流量	Claude Opus 4.6/4.7	份額下滑（約 12%）	美元份額約 46%	企業複雜推理、合規場景
性價比·中流量	Gemini 3 Flash	穩定增長	中等 ARPU	多模態、學術文件
極低價·高流量	DeepSeek / Hy3 / MiniMax	合計占平台 45%+	收入占比遠低於 Token 占比	Agent、程式設計、批次處理

Anthropic 溢價悖論：企業級使用者仍為 Claude 付高價（Opus 月收入可達約 2500 萬美元 量級報導），但流量主導權已讓渡給低價開源矩陣。這不是 Anthropic「輸了」，而是市場分裂為美元軌與Token 軌——Mac 團隊應雙軌配置：日常 Agent 走 Token 軌，架構/安全稽核走 Dollar 軌（詳見雙軌讀法文）。

6. 反直覺發現：評測分數與市場份額的反轉

OpenRouter 與 a16z 聯合發布的《2025 AI 使用報告》覆蓋約 100 兆 Token 匿名中繼資料，核心發現令人不安：模型的基準測試分數與其實際市場份額幾乎呈反比。原因並不神秘：開發者更關心推理成本、API 延遲與工具呼叫穩定性，而非極限單點分數；Agent 工作流需要可預測的吞吐，而非偶爾刷出的 SOTA。程式設計任務占比過半進一步放大這一效應——SWE-bench 高分模型若定價 $25/M output，在日均百萬 Token 的 IDE 場景下會被 V4-Flash（約 $0.14/M 量級）迅速替代。結論：帳單上的數字，比任何評測榜單都誠實。

7. 五步落地：把週榜寫進 Mac 工作流

Step 1 — 每週一開啟 rankings，存檔 Top 10 diff

記錄名次變化與週環比 >30% 的模型；新進前十（如 Owl Alpha）往往是下一波路由熱點。

Step 2 — 按任務拆鏈，禁止「一個預設走天下」

Agent/批次處理 → DeepSeek-V4-Flash；企業複雜推理 → Claude Opus；多模態 → Gemini Flash。IDE 與 OpenClaw 分開配置。

Step 3 — 標註 Mac 三檔：本機 MLX / OpenRouter API / 遠端 Mac

7B–32B 量化穩態 → 本機；1M 上下文與實驗模型 → API；7×24 OpenClaw Gateway → 遠端 Mac launchd 常駐。

Step 4 — 設 Dollar 軌月度預算上限

Opus/GPT 僅用於架構評審；月度 Token 超預算 15% 自動降級到 V4-Flash 或 Hy3。

Step 5 — 50 prompt 週更驗收

同一套 prompt 在本機、OpenRouter、遠端 Mac 各跑一遍，對比延遲、$/M 與 tool-call 成功率。

# OpenRouter 週榜路由骨架（openclaw.json 範例）
token_track:
  primary:  openrouter/deepseek/deepseek-v4-flash
  fallback: [ openrouter/tencent/hy3-preview, openrouter/minimax/m2.7 ]
dollar_track:
  primary:  openrouter/anthropic/claude-opus-4.7
  budget_cap_usd: 800   # 月度硬頂
gray_pool:
  model:    openrouter/openrouter/owl-alpha
  max_share: 0.10       # 禁敏感資料
                

8. 深度案例：一家 6 人 Mac 團隊如何用週榜把月費打下來

「團隊原預設 Claude Sonnet 全場景，月 OpenRouter 約 $3,200。對照 5 月 18–24 週榜後：62% Token 切到 DeepSeek-V4-Flash（Agent + Cursor），18% Hy3 preview 灰度，12% Gemini 3 Flash 多模態，僅 8% 保留 Opus 做安全稽核。四週後帳單 $1,940（-39%），P95 工具呼叫延遲降 14%。關鍵動作：把 OpenClaw Gateway 遷到遠端 Mac M4 Max 64GB 記憶體，本機 16GB Air 不再 7×24 硬扛——統一記憶體留給 FCP 與 ComfyUI。」

案例印證大綱核心論點：不是誰最聰明，而是誰最被調用，才推動 AI 真正落地。投資者用週榜評估商業化進度（OpenRouter 估值曾達約 26× PS 量級報導）；開發者用它選模型；研究機構追蹤產業趨勢——Token 調用量已從「技術指標」升級為商業戰場晴雨表。

9. 可引用數字與驗收清單

① 全球週調用：28.9 兆 Token（+7.4%）。② 中國模型週調用：9.223 兆（+19.89%）。③ DeepSeek 系列合計：5.74 兆。④ Anthropic：約 12% Token / 46% 美元收入。⑤ 一年週量級增長：約 12 倍（2.4T→28.9T）。⑥ 程式設計任務 Token 占比：11%→50%+。

純 Windows/Linux 或雲端主機同樣能接 OpenRouter，但在與 Xcode、Final Cut、ComfyUI 並行、launchd 常駐 OpenClaw、Metal 側車 MLX 驗證的一體化工作流上，macOS 仍更順暢。若你希望「本機穩態推理」與「週榜實驗模型 + 兆級 Agent API」物理隔離，避免 16GB 筆電被 Gateway 占滿統一記憶體，MACGPU 遠端 Mac 節點可專跑 OpenClaw 與灰度路由，本機只保留 Cursor 審閱與 Dollar 軌——用租賃算力換可預測的月費與溫控。