2026 OPENROUTER
TOOL_
CALLS_
AGENT_
MAC.
openrouter.ai/rankings を開くと、2026年5月26日に OpenRouter が Series B $113M を発表し、プラットフォームの週次処理量は約 25T tokens(半年前は約 5T/週)に達しています。ランキングはもはや「誰が最もチャットしているか」だけではありません。総合榜と Programming に加え、Tool Calls、Market Share(ベンダー別)、Agent/App 次元の日次 token が、Mac 上で OpenClaw / Hermes / Cursor Agent を運用する方が注視すべきスライスです。5月10日前後、Hermes Agent の日次 token ~224B が OpenClaw ~186B を初めて上回りましたが、OpenClaw の累計は依然 ~9.17T vs Hermes ~6.35T——これは「日次榜の入れ替わり」であり「エコシステムの交代」ではありません。本稿では分榜の読み方 — Tool Calls スナップショット — Agent 榜の変化 — ベンダー市占 — Mac 三レーン分流 — 六ステップ実装 — 検収チェックリストを順にご説明します。サイト内の《5月総合ランキング意思決定マトリクス》《Programming 分榜》《OpenClaw 429 マルチモデル降格》と役割分担します。
1. 痛点の整理:総合榜は Agent を救わず、Programming 榜も Tool Call を救いません
1)次元のずれ:総合 #1 MiMo-V2-Pro は汎用チャットに強い一方、tool call の安定性を保証しません。Programming 分榜は「コード流量」を測るもので、exec / MCP / ブラウザ / ファイルシステムのツールチェーンではありません。2)Agent ランタイム ≠ ベースモデル:Hermes の日次榜リードは「自己改善 + 永続メモリ」路線の伸びを示しますが、OpenClaw の ClawHub、マルチチャネル、launchd 常駐は依然として本番のデフォルトです——日次榜を追うか累計を追うかで、意思決定は全く異なります。3)Tool Calls はコストが高い:1 Agent ターンに 8–20 回の tool round-trip が含まれることは珍しくなく、同一主モデルでも token は純チャットの 3–5× になり得ます。Gemini Flash と Opus 4.7 を誤選すると、月次請求は桁が変わります。4)Mac ローカルに Agent 主モデルは載らない:Tool Calls 分榜上位は閉源または超大 MoE が多く、OpenRouter API が必須です。ローカルでは 30B 級の「ツール補助モデル」で下書きやフィルタに留まります。5)設定ドリフト:openclaw.json の主モデルと OpenRouter fallback を週次で更新しないと、429 後の fallback 書き戻しで、Agent は先週の榜外モデルを走っていることになります。
2. 5月末の OpenRouter 多次元ランキングの読み方
| 分榜/スライス | 答える問い | Mac ユーザー向け典型アクション |
|---|---|---|
| Top Models(総合) | 全サイト週 token 首位 | 日常チャット/API デフォルト(0525 記事参照) |
| Programming / Python | IDE 補完・リファクタ流量 | Cursor/Cline コーディングルート(0526 記事参照) |
| Tool Calls | tools 付きリクエストの担い手 | OpenClaw / Hermes / 自前 Agent の主モデル + fallback |
| Market Share | ベンダー別 token シェア | 「中国系 OSS vs 欧米閉源」のコスト・コンプライアンス評価 |
| Languages / Context / Images / Audio | 言語、コンテキスト長、マルチモーダル | RAG 長鎖、ビジュアル Agent の個別ルート |
| Agent/App 日次 token(公開報道) | 最も熱い Agent スタック | Hermes vs OpenClaw vs 純 IDE Agent の選択 |
5/26 の資金調達稿では、ランキングが投資家・メディアが引用する「real adoption」指標の一つになったと強調されています。実務では、Agent ワークフローは毎週月曜に Tool Calls + Agent 日次榜を揃え、毎月 Market Share を見て「主ベンダーのルート変更」を検討するのがよいでしょう。
3. Tool Calls 分榜スナップショット(2026-05-27 週、Agent ワークフロー視点)
| ティア | 代表モデル(OpenRouter ID 例) | Tool シーンの強み | Mac パス |
|---|---|---|---|
| T1 高スループット低価格 | deepseek/deepseek-v4-flash、google/gemini-3-flash-preview | 多段 tool ループ、コスト重視 | API のみ;ローカル Qwen3 30B で事前スクリーニング |
| T2 バランス | anthropic/claude-sonnet-4.6、moonshotai/kimi-k2.6 | 長鎖 Agent、安定 JSON tool schema | 主に API;Kimi 蒸留はリモート Mac |
| T3 難タスク兜底 | anthropic/claude-opus-4.7、openai/gpt-5.5-pro | 複雑 MCP、クロスツール推論 | API のみ;$/day ハードキャップ設定 |
| T4 OSS 実験 | qwen/qwen3.7-max、xiaomi/mimo-v2-pro | 監査可能、自前ゲートウェイ | リモート Mac 128GB+ または API |
Tool Calls 分榜と Programming 分榜の重複は約 50%–60% ですが、順位は異なります。Gemini 3 Flash Preview は tool シーンで「純プログラミング」榜より高いことが多く、Agent フレームワークが「安価なマルチモーダル tool ワーカー」としてデフォルト設定するためです。OpenClaw ユーザーは openclaw.json で tools.profile と主モデルを分離してください:主モデルは T1/T2、fallback チェーンに T3 を残します。
4. Agent 榜の変局:Hermes 日次 token vs OpenClaw 累計
| 指標 | Hermes Agent | OpenClaw | 選び方 |
|---|---|---|---|
| 日次 token(約 5/10) | ~224B | ~186B | 日次榜:Hermes の熱度が高い |
| 累計 token | ~6.35T | ~9.17T | エコシステム:OpenClaw が厚い |
| メモリモデル | 三層永続メモリ + SQLite FTS | セッション外付け / MEMORY.md | 長期タスクは Hermes 寄り |
| Mac 本番 | 新しめのスタック、ドキュメント少 | launchd、ClawHub、サイト内 Runbook 多数 | 7×24 は依然 OpenClaw 多め |
| モデル入口 | 主に OpenRouter | OpenRouter + ベンダー直結 | いずれも Tool Calls 分榜に揃える |
結論:日次榜を追うのは自己改善 Agent の試作向き、累計 + 運用成熟度を追うのは企業 WeChat/Telegram 常駐向きです。Mac 上ではどちらも「Gateway 内のモデルルート」だけ差し替え可能で、二者択一は不要です——Hermes を実験サンドボックス、OpenClaw を本番チャネルとし、同一 OpenRouter key と同一 Tool Calls 主モデルを共有できます。
5. Market Share と 25T/週:Mac 意思決定への意味
公開報道と業界分析は一致しており、中国系モデルの OpenRouter 合計 token シェアは 45%超(1年前は約 2%)に達しています。5/26 以降の週次規模は約 25T tokens です。Market Share 分榜では Google、Anthropic、DeepSeek、Moonshot、Xiaomi などが交替リードし、単一ベンダー >25% の独占はありません——Mac ユーザーにとっては OpenRouter で「ベンダーレベル failover」が可能で、1社 API にロックインされない利点があります。実務では:主ルートに Tool Calls 分榜 T1(DeepSeek V4 Flash / Gemini 3 Flash)、ベンダーバックアップに別社(例:Anthropic Sonnet)を選び、同一クラウド障害ですべての Agent チャネルが止まるのを避けてください。
6. 六ステップ実装:Tool Calls 分榜 → Mac Agent スタック
Step 1 — 毎週 Tool Calls + Agent スナップショットを取得
openrouter.ai/rankings で Tool Calls、Market Share を切り替えて固定アクセスします。API 側は GET /api/v1/models?supported_parameters=tools で pricing と context を保存します。
Step 2 — Agent 負荷を四バケットに分類
軽量 tool(1–3 回) / 標準 Agent(4–10 回) / 重 MCP(10+ 回) / マルチモーダル tool(画像+文)。各バケットに T1–T3 の主・備を1つずつ割り当てます。
Step 3 — OpenClaw:openclaw.json を揃える
主モデルは T1;fallback 配列は T2→T3;tools.profile で高危険 exec を制限;Gateway は https://openrouter.ai/api/v1 を使用します。
Step 4 — Hermes / Cursor Agent:同一 key、異なる runtime
Hermes 実験時も本番と同じ Tool Calls 主モデルを使い、「実験スタックは高価モデル、本番は安価モデル」という比較の歪みを避けます。
Step 5 — ローカル 30B + リモート Mac 128GB
ローカル Qwen3 30B で tool 引数の事前検査;リモート Mac で 72B または Kimi 蒸留を走らせ、SSH トンネルで OpenClaw サブエージェントに供給します。
Step 6 — 30分プローブ + 日次上限
各ルート本番前:tool 付き prompt 10 件で tool 成功率 >90%、p95 ターン <45s を確認;OpenRouter ダッシュボードで $/day hard cap を設定します。
7. 三レーン意思決定マトリクス:ローカル / リモート Mac / OpenRouter API
| Agent シーン | パス | 代表構成 | 検収 |
|---|---|---|---|
| 軽量 tool / 事前検査 | ローカル MLX | Qwen3 30B @ 8081 | tool JSON 合法率 >95% |
| チャネル常駐 7×24 | リモート Mac + OpenClaw | launchd + OpenRouter T1 | 24h 無断、429<1% |
| 多段 MCP / ブラウザ | OpenRouter API | V4 Flash → Sonnet → Opus | ターン p95 <60s |
| Hermes 実験 | ローカルまたはリモートサンドボックス | 本番と同 T1 モデル | メモリ検索遅延 <500ms |
| ピーク分流 | リモート Mac 128GB | macMLX + サブエージェント | 夜間 6h OOM なし |
8. 深度ケース:運用チームが Tool Calls 分榜で OpenClaw を再配線し、Agent 月次 token を 41% 削減
「6名の運用チーム。OpenClaw を Telegram + 企業 WeChat に常駐させ、主モデルは Opus 4.7 固定で月次 OpenRouter 請求 $4,100。5月中旬に Tool Calls 分榜に基づき再配線:デフォルト deepseek-v4-flash、Sonnet 4.6 は browser+exec を含むセッションのみ、Opus は手動 /deep-debug のみ。Gateway を MACGPU リモート M4 Max 128GB に移し、ローカル MacBook は SSH 管理のみ。30日後、Agent 月次 token は 820B から 480B に、請求 $2,420、41% 削減;tool 失敗率は 4.2% から 2.1%(ローカル 30B 事前検査追加の効果)。」
本ケースが示すのは、Agent コストの主因は tool ターン数 × 主モデル単価であり、「どの Agent フレームワークを選ぶか」ではないという点です。Hermes の日次榜がどれだけ高くても、ベースが Opus なら請求は爆発します。OpenClaw の累計がどれだけ厚くても、ベースを Tool Calls T1 に替えれば同様に節約できます。リモート Mac の価値はGateway と重負荷をノート PC から切り離すことにあり、7×24 と日中開発が unified memory を奪い合いません。
9. 業界インサイト:Agent 時代のランキングは「ランタイム榜」と「Tool モデル榜」に分裂する
25T tokens/週 は、プラットフォームデータが「チャット製品」から「Agent インフラ」へ移行したことを意味します。2026年下半期には二つの平行榜が出現します:最も熱い Agent ランタイム(Hermes、OpenClaw、ベンダー IDE Agent)と最も安定した tool-calling モデル(Flash 系が量を取り、Opus 系が兜底)。Mac の独自性は、同一マシンで Gateway(Node + launchd)、MLX 事前検査、ComfyUI/Whisper を並走できる点にあり、unified memory はマルチ Agent 並列時の隠れた切り札です。Windows/Linux は単一 GPU VRAM では強い一方、「昼はノート開発 + 夜は Agent 常時稼働」はリモート Mac レンタルが現実的な選択肢になりがちです。
ローカル 32GB に 72B 事前検査が載らず、すべての tool ターンをクラウドに任せたくない場合、最もクリーンな道はリモート Apple Silicon Mac をレンタルすることです。MACGPU の M3/M4 Max 128GB ノードは OpenClaw Gateway + macMLX をプリインストールでき、IDE とモバイルチャネルが同一 OpenRouter ルート表を共有し、Tool Calls 分榜で「ローカルに載らない」部分を LAN 内で完結させます。
10. 引用可能な数値と FAQ
① OpenRouter 週次処理量(5/26 発表):~25T tokens/週。② Hermes vs OpenClaw 日次 token(約 5/10):224B vs 186B。③ OpenClaw 累計 token(報道口径):~9.17T。④ 中国系モデル OpenRouter シェア(業界分析):>45%。⑤ Agent tool ターン token 倍率(純チャット比):約 3–5×。⑥ ケース請求変化:$4,100 → $2,420(-41%)。
Q:総合榜はまだ見るべき?A:はい。ただし Agent ルートは Tool Calls を主とします。Q:Hermes は OpenClaw を置き換える?A:日次榜はトレンド、本番はチャネルと運用——併用可能です。Q:Mac で Tool Calls 首位をローカル実行?A:首位は多く API-only;ローカル 30B は補助です。Q:MACGPU は何を解決?A:リモート 7×24 Gateway + 大容量 MLX、ローカルは管理のみでピークを背負わない。