2026 OPENROUTER
TOKEN_
VS_
REVENUE_
MAC.
打开 openrouter.ai/rankings,你会看到 Top Models、Market Share、Trending 等多张榜——但账单与「谁最火」往往对不上号。5 月系列已拆过总榜、编程、Tool Calls、多模态输入与出图/Language分榜;6 月初必须单独讲清「双轨读法」:按周 token 量选默认模型,与按美元收入/单价控预算,是两套逻辑。第三方对 OpenRouter 公开 endpoint 的 2026-05-30 快照显示全站约 31.34T tokens/周、估算周收入 $32.4M;Anthropic 约占 42% 收入,token 份额却仅约 11%,而 Xiaomi MiMo-V2.5-Pro 周 token 约 2.30T(+432% 周环比),收入仅约 $438K。本文给出6 月初快照 — 双轨对照 — Provider 层 — 周环比异动 — 六步落地 — 决策矩阵 — 案例 — 验收清单。
1. 痛点拆解:跟错榜 = 成本爆炸或能力欠配
1)把 Top Models 当「最强」:总榜前列多为 MiMo-V2.5、DeepSeek V4、Qwen 等低价高吞吐模型,适合 Agent 灌 token,不等于复杂推理最优。2)忽视收入榜:Claude Opus 4.7 在部分 Provider 路由下 token 不多,却因 $5/$25 per M 级定价吃掉预算大头。3)混淆「模型作者」与「路由商」:SiliconFlow 周 token 约 4.04T(仅次于 Google 的 4.28T),Market Share 里却可能显示为 DeepSeek/Qwen 等底座——运维改的是 Provider,不是作者名。4)周环比暴涨未设顶:Xiaomi token +432%、Alibaba +75% 一周,若 Cursor/OpenClaw 默认模型写死,fallback 可能突然切到未测过的路径。5)Mac 本机与 API 未分流:能在 MLX 跑的 DeepSeek/Qwen 仍走 OpenRouter,统一内存空转的同时 API 账单上涨。
2. 6 月初三句话读懂 OpenRouter 全站
| 维度 | 6 月初快照(公开汇总口径) | Mac 读法 |
|---|---|---|
| 全站吞吐 | ~31.34T tokens/周;~$32.4M 周收入(估算) | Agent 规模化已常态,须分桶预算 |
| Token 量 #1 路由商 | Google ~4.28T;SiliconFlow ~4.04T | 看 Provider 稳定性,不只看模型名 |
| Token 量暴涨 | Xiaomi +432% WoW;Stealth/Owl ~1.58T 新兴 | 每周 diff 默认模型与 fallback |
| 收入 #1 | Anthropic ~42%(~$13.6M/周) | 难任务兜底,非日常默认 |
| 中国系 token | 合计仍 >60%(多家分析一致) | 成本友好;合规单独评估 |
3. 双轨对照:用量王 vs 收入王(为何不是同一批模型)
| 轨道 | 代表 | 周 token(约) | 周收入(约) | 典型 Mac 用途 |
|---|---|---|---|---|
| 用量王 | MiMo-V2.5-Pro、DeepSeek V4 Pro、Qwen 3.6+ | 小米 2.30T;DeepSeek 1.32T | 小米 ~$438K;DeepSeek ~$219K | Cursor 补全、OpenClaw 日常 Agent |
| 收入王 | Claude Opus 4.7、GPT-5.5 | Anthropic 3.51T(全族) | Anthropic ~$13.6M(42%) | 架构评审、难 bug、合规兜底 |
| 错位典型 | Google 路由 + Claude 计费 | Google token 最高 | Bedrock/Azure 叠 Anthropic 价 | 检查 IDE 里实际 Provider |
结论:跟 Top Models / Market Share 选「默认便宜模型」;跟收入结构选「贵模型配额」。二者同时成立——平台在「commodity token」与「premium dollar」之间分层,Mac 团队应维护两张路由表,而非一张。
4. Provider 层:SiliconFlow、Novita 与「作者榜」不是一回事
OpenRouter 的 Market Share 按模型作者(Xiaomi、Qwen、Anthropic)切;实际请求还经过 Provider(SiliconFlow、Novita、DeepInfra、官方直连等)。5/30 快照中 SiliconFlow ~4.04T token 但收入仅 ~$609K,说明大量流量走极低边际价通道;Novita ~1.77T 周环比 -19%,说明路由商也会剧烈洗牌。Mac 上配置 OpenRouter 时,除 model 字段外,应记录实际命中的 provider(OpenRouter Usage 面板),避免「同名模型、不同延迟/限流」。
5. 周环比警报:暴涨模型如何写 fallback
一周内 Xiaomi token +1.87T(+432%)、Alibaba +612B(+75%);StepFun、Novita、Moonshot 等显著下滑。建议 OpenClaw / Cursor 采用三层 fallback:① 默认:MiMo-V2.5 或 DeepSeek V4 Flash(用量榜 + 低价);② 质量:Qwen3.7 / GLM-5;③ 兜底:Claude Opus 4.7(限每日 token 上限)。暴涨周禁止无上限自动升级默认模型——先在远程 Mac 或本机跑 50 条回归 prompt 再切生产。
6. 六步落地:双轨榜 → Mac 路由表
Step 1 — 每周打开 rankings + Usage
记录 Top Models 前五与自家账单 Top3 模型是否一致;不一致即已「跟错轨」。
Step 2 — 建 Token 轨与 Dollar 轨两张表
Token 轨写默认与 Agent;Dollar 轨写 Opus/GPT 单日 cap(如 $20/天)。
Step 3 — 标注 Provider
对 DeepSeek V4 Pro 等记录 SiliconFlow vs 官方延迟 P95。
Step 4 — 本机 MLX 对照
能在 Apple Silicon 量化的 Qwen/DeepSeek 小尺寸,白天走本机 /v1,夜间 Agent 走 OpenRouter。
Step 5 — OpenClaw openclaw.json 对齐
主模型与 fallback 数组分轨;见 fallback 漂移 Runbook。
Step 6 — 429/限流时先降轨再升轨
先切 Token 轨备选,再升 Dollar 轨;避免一上来 Opus 全家桶。
7. 三档决策矩阵:本机 MLX / OpenRouter API / 远程 Mac
| 场景 | 路径 | 跟哪张榜 | 验收 |
|---|---|---|---|
| IDE 日常补全 | 本机 Ollama/MLX 或 OpenRouter 低价线 | Token 轨 Top5 | P95 <800ms;$<0.3/M 等效 |
| OpenClaw 7×24 Agent | 远程 Mac Gateway + OpenRouter | Token 轨 + Provider 稳定 | 24h 无断连;日 token 可预测 |
| 架构/安全评审 | OpenRouter Opus 4.7 | Dollar 轨 | 单日 cap;任务结束自动降轨 |
| 编程重任务 | DeepSeek V4 Flash + Opus 兜底 | 编程分榜 + Dollar 轨 | 见 0526 编程分榜文 |
| 本机 32GB 满载 | 远程 Mac 128GB 跑 MLX 对照 | 与 API A/B | TTFT 与 $/1M 同表记录 |
8. 深度案例:10 人 Mac 团队双轨重排,OpenRouter 月费降 38%
「10 人全栈,MacBook Pro M3 Max 36GB + Studio M2 Ultra:Cursor 默认 Claude Opus 4.7(跟「能力直觉」),OpenClaw 走 MiMo,月 OpenRouter $6,800。6 月初按双轨表改配:80% 交互改 MiMo-V2.5 + DeepSeek V4 Flash(Token 轨);Opus 仅 PR 安全审查(Dollar 轨 cap $15/人/天);DeepSeek 经 SiliconFlow 与官方 A/B,P95 相近选低价;Studio 夜间跑 MLX Qwen 32B 消化 40% 补全。30 天后 $4,220,降 38%;Opus 调用次数 -71%,难任务满意度不降。」
案例说明:账单大头来自 Dollar 轨误作默认,而非「OpenRouter 太贵」。Top Models 上的中国开源模型适合灌量;Opus 应像「急诊室」而非常驻门诊。
9. 行业洞察:双轨结构将长期存在
31T tokens/周 时代,推理市场已分裂为commodity token 层(中国开源 + 路由商竞价)与premium dollar 层(Anthropic/Google/OpenAI 高价线)。Stealth 模型(如 Owl Alpha)周 token 破 1.5T 说明「榜单隐身」流量也不容忽视。Mac 生态的优势在于:同一台机器可跑 MLX 验证 Token 轨模型,再与 OpenRouter 对照;Windows/Linux 云主机虽能挂 Agent,但在与 Xcode/Cursor 本机联调、ColorSync 素材链、launchd 常驻 Gateway上仍弱于 macOS。若本机 Agent + IDE 同时抢 36GB 统一内存,最干净方案是远程 Apple Silicon Mac 常驻 OpenClaw,本机只保留 Cursor 与 Dollar 轨兜底。
纯 Windows 或云 GPU 能跑通 OpenRouter API,但 7×24 Gateway、Metal 侧车推理与图形工作流并存时,维护成本往往更高。若你希望 Agent 稳定跑满 Token 轨、本机只承担审阅与贵模型兜底,可考虑 MACGPU 远程 Mac 节点 预装 OpenClaw + 路由表模板,与本机双轨策略对齐验收。
10. 可引用数字与 FAQ
① 全站周 token(5/30 口径):~31.34T。② 周收入估算:~$32.4M。③ Anthropic 收入份额:~42%;token 份额 ~11%。④ Xiaomi 周 token:~2.30T(+432% WoW)。⑤ SiliconFlow 周 token:~4.04T。⑥ 案例月费:$6,800 → $4,220(-38%)。
问:还看 5 月分榜吗?答:要,编程/Tool/多模态/出图仍按分榜;本文补「双轨 + Provider」。问:MiMo 能替代 Opus 吗?答:不能全局替代;分轨使用。问:MACGPU 解决什么?答:远程 Mac 扛 Token 轨 Agent 峰值,本机保 Dollar 轨与 MLX 对照。