2026 OPENROUTER
TOOL_
CALLS_
AGENT_
MAC.

AI Agent と OpenRouter 多軸ランキングの抽象ビジュアル

openrouter.ai/rankings を開くと、2026年5月26日に OpenRouter が Series B $113M を発表し、プラットフォームの週次処理量は約 25T tokens(半年前は約 5T/週)に達しています。ランキングはもはや「誰が最もチャットしているか」だけではありません。総合榜と Programming に加え、Tool CallsMarket Share(ベンダー別)、Agent/App 次元の日次 token が、Mac 上で OpenClaw / Hermes / Cursor Agent を運用する方が注視すべきスライスです。5月10日前後、Hermes Agent の日次 token ~224B が OpenClaw ~186B を初めて上回りましたが、OpenClaw の累計は依然 ~9.17T vs Hermes ~6.35T——これは「日次榜の入れ替わり」であり「エコシステムの交代」ではありません。本稿では分榜の読み方 — Tool Calls スナップショット — Agent 榜の変化 — ベンダー市占 — Mac 三レーン分流 — 六ステップ実装 — 検収チェックリストを順にご説明します。サイト内の《5月総合ランキング意思決定マトリクス》《Programming 分榜》《OpenClaw 429 マルチモデル降格》と役割分担します。

1. 痛点の整理:総合榜は Agent を救わず、Programming 榜も Tool Call を救いません

1)次元のずれ:総合 #1 MiMo-V2-Pro は汎用チャットに強い一方、tool call の安定性を保証しません。Programming 分榜は「コード流量」を測るもので、exec / MCP / ブラウザ / ファイルシステムのツールチェーンではありません。2)Agent ランタイム ≠ ベースモデル:Hermes の日次榜リードは「自己改善 + 永続メモリ」路線の伸びを示しますが、OpenClaw の ClawHub、マルチチャネル、launchd 常駐は依然として本番のデフォルトです——日次榜を追うか累計を追うかで、意思決定は全く異なります。3)Tool Calls はコストが高い:1 Agent ターンに 8–20 回の tool round-trip が含まれることは珍しくなく、同一主モデルでも token は純チャットの 3–5× になり得ます。Gemini Flash と Opus 4.7 を誤選すると、月次請求は桁が変わります。4)Mac ローカルに Agent 主モデルは載らない:Tool Calls 分榜上位は閉源または超大 MoE が多く、OpenRouter API が必須です。ローカルでは 30B 級の「ツール補助モデル」で下書きやフィルタに留まります。5)設定ドリフト:openclaw.json の主モデルと OpenRouter fallback を週次で更新しないと、429 後の fallback 書き戻しで、Agent は先週の榜外モデルを走っていることになります。

2. 5月末の OpenRouter 多次元ランキングの読み方

分榜/スライス答える問いMac ユーザー向け典型アクション
Top Models(総合)全サイト週 token 首位日常チャット/API デフォルト(0525 記事参照)
Programming / PythonIDE 補完・リファクタ流量Cursor/Cline コーディングルート(0526 記事参照)
Tool Callstools 付きリクエストの担い手OpenClaw / Hermes / 自前 Agent の主モデル + fallback
Market Shareベンダー別 token シェア「中国系 OSS vs 欧米閉源」のコスト・コンプライアンス評価
Languages / Context / Images / Audio言語、コンテキスト長、マルチモーダルRAG 長鎖、ビジュアル Agent の個別ルート
Agent/App 日次 token(公開報道)最も熱い Agent スタックHermes vs OpenClaw vs 純 IDE Agent の選択

5/26 の資金調達稿では、ランキングが投資家・メディアが引用する「real adoption」指標の一つになったと強調されています。実務では、Agent ワークフローは毎週月曜に Tool Calls + Agent 日次榜を揃え、毎月 Market Share を見て「主ベンダーのルート変更」を検討するのがよいでしょう。

3. Tool Calls 分榜スナップショット(2026-05-27 週、Agent ワークフロー視点)

ティア代表モデル(OpenRouter ID 例)Tool シーンの強みMac パス
T1 高スループット低価格deepseek/deepseek-v4-flash、google/gemini-3-flash-preview多段 tool ループ、コスト重視API のみ;ローカル Qwen3 30B で事前スクリーニング
T2 バランスanthropic/claude-sonnet-4.6、moonshotai/kimi-k2.6長鎖 Agent、安定 JSON tool schema主に API;Kimi 蒸留はリモート Mac
T3 難タスク兜底anthropic/claude-opus-4.7、openai/gpt-5.5-pro複雑 MCP、クロスツール推論API のみ;$/day ハードキャップ設定
T4 OSS 実験qwen/qwen3.7-max、xiaomi/mimo-v2-pro監査可能、自前ゲートウェイリモート Mac 128GB+ または API

Tool Calls 分榜と Programming 分榜の重複は約 50%–60% ですが、順位は異なります。Gemini 3 Flash Preview は tool シーンで「純プログラミング」榜より高いことが多く、Agent フレームワークが「安価なマルチモーダル tool ワーカー」としてデフォルト設定するためです。OpenClaw ユーザーは openclaw.jsontools.profile と主モデルを分離してください:主モデルは T1/T2、fallback チェーンに T3 を残します。

4. Agent 榜の変局:Hermes 日次 token vs OpenClaw 累計

指標Hermes AgentOpenClaw選び方
日次 token(約 5/10)~224B~186B日次榜:Hermes の熱度が高い
累計 token~6.35T~9.17Tエコシステム:OpenClaw が厚い
メモリモデル三層永続メモリ + SQLite FTSセッション外付け / MEMORY.md長期タスクは Hermes 寄り
Mac 本番新しめのスタック、ドキュメント少launchd、ClawHub、サイト内 Runbook 多数7×24 は依然 OpenClaw 多め
モデル入口主に OpenRouterOpenRouter + ベンダー直結いずれも Tool Calls 分榜に揃える

結論:日次榜を追うのは自己改善 Agent の試作向き、累計 + 運用成熟度を追うのは企業 WeChat/Telegram 常駐向きです。Mac 上ではどちらも「Gateway 内のモデルルート」だけ差し替え可能で、二者択一は不要です——Hermes を実験サンドボックス、OpenClaw を本番チャネルとし、同一 OpenRouter key と同一 Tool Calls 主モデルを共有できます。

5. Market Share と 25T/週:Mac 意思決定への意味

公開報道と業界分析は一致しており、中国系モデルの OpenRouter 合計 token シェアは 45%超(1年前は約 2%)に達しています。5/26 以降の週次規模は約 25T tokens です。Market Share 分榜では Google、Anthropic、DeepSeek、Moonshot、Xiaomi などが交替リードし、単一ベンダー >25% の独占はありません——Mac ユーザーにとっては OpenRouter で「ベンダーレベル failover」が可能で、1社 API にロックインされない利点があります。実務では:主ルートに Tool Calls 分榜 T1(DeepSeek V4 Flash / Gemini 3 Flash)、ベンダーバックアップに別社(例:Anthropic Sonnet)を選び、同一クラウド障害ですべての Agent チャネルが止まるのを避けてください。

6. 六ステップ実装:Tool Calls 分榜 → Mac Agent スタック

Step 1 — 毎週 Tool Calls + Agent スナップショットを取得

openrouter.ai/rankingsTool CallsMarket Share を切り替えて固定アクセスします。API 側は GET /api/v1/models?supported_parameters=tools で pricing と context を保存します。

Step 2 — Agent 負荷を四バケットに分類

軽量 tool(1–3 回) / 標準 Agent(4–10 回) / 重 MCP(10+ 回) / マルチモーダル tool(画像+文)。各バケットに T1–T3 の主・備を1つずつ割り当てます。

Step 3 — OpenClaw:openclaw.json を揃える

主モデルは T1;fallback 配列は T2→T3;tools.profile で高危険 exec を制限;Gateway は https://openrouter.ai/api/v1 を使用します。

Step 4 — Hermes / Cursor Agent:同一 key、異なる runtime

Hermes 実験時も本番と同じ Tool Calls 主モデルを使い、「実験スタックは高価モデル、本番は安価モデル」という比較の歪みを避けます。

Step 5 — ローカル 30B + リモート Mac 128GB

ローカル Qwen3 30B で tool 引数の事前検査;リモート Mac で 72B または Kimi 蒸留を走らせ、SSH トンネルで OpenClaw サブエージェントに供給します。

Step 6 — 30分プローブ + 日次上限

各ルート本番前:tool 付き prompt 10 件で tool 成功率 >90%、p95 ターン <45s を確認;OpenRouter ダッシュボードで $/day hard cap を設定します。

# Tool 対応モデル一覧 curl -s "https://openrouter.ai/api/v1/models" \ | jq '.data[] | select(.supported_parameters[]? == "tools") | {id, pricing, context_length}' \ > /tmp/or-tools-$(date +%Y%m%d).json # openclaw.json 断片(主モデル + fallback、示意) { "agents": { "defaults": { "model": { "primary": "deepseek/deepseek-v4-flash", "fallbacks": [ "google/gemini-3-flash-preview", "anthropic/claude-sonnet-4.6", "anthropic/claude-opus-4.7" ] } } } } # 日次上限:OpenRouter Dashboard → Limits → daily budget

7. 三レーン意思決定マトリクス:ローカル / リモート Mac / OpenRouter API

Agent シーンパス代表構成検収
軽量 tool / 事前検査ローカル MLXQwen3 30B @ 8081tool JSON 合法率 >95%
チャネル常駐 7×24リモート Mac + OpenClawlaunchd + OpenRouter T124h 無断、429<1%
多段 MCP / ブラウザOpenRouter APIV4 Flash → Sonnet → Opusターン p95 <60s
Hermes 実験ローカルまたはリモートサンドボックス本番と同 T1 モデルメモリ検索遅延 <500ms
ピーク分流リモート Mac 128GBmacMLX + サブエージェント夜間 6h OOM なし

8. 深度ケース:運用チームが Tool Calls 分榜で OpenClaw を再配線し、Agent 月次 token を 41% 削減

「6名の運用チーム。OpenClaw を Telegram + 企業 WeChat に常駐させ、主モデルは Opus 4.7 固定で月次 OpenRouter 請求 $4,100。5月中旬に Tool Calls 分榜に基づき再配線:デフォルト deepseek-v4-flash、Sonnet 4.6 は browser+exec を含むセッションのみ、Opus は手動 /deep-debug のみ。Gateway を MACGPU リモート M4 Max 128GB に移し、ローカル MacBook は SSH 管理のみ。30日後、Agent 月次 token は 820B から 480B に、請求 $2,420、41% 削減;tool 失敗率は 4.2% から 2.1%(ローカル 30B 事前検査追加の効果)。」

本ケースが示すのは、Agent コストの主因は tool ターン数 × 主モデル単価であり、「どの Agent フレームワークを選ぶか」ではないという点です。Hermes の日次榜がどれだけ高くても、ベースが Opus なら請求は爆発します。OpenClaw の累計がどれだけ厚くても、ベースを Tool Calls T1 に替えれば同様に節約できます。リモート Mac の価値はGateway と重負荷をノート PC から切り離すことにあり、7×24 と日中開発が unified memory を奪い合いません。

9. 業界インサイト:Agent 時代のランキングは「ランタイム榜」と「Tool モデル榜」に分裂する

25T tokens/週 は、プラットフォームデータが「チャット製品」から「Agent インフラ」へ移行したことを意味します。2026年下半期には二つの平行榜が出現します:最も熱い Agent ランタイム(Hermes、OpenClaw、ベンダー IDE Agent)と最も安定した tool-calling モデル(Flash 系が量を取り、Opus 系が兜底)。Mac の独自性は、同一マシンで Gateway(Node + launchd)、MLX 事前検査、ComfyUI/Whisper を並走できる点にあり、unified memory はマルチ Agent 並列時の隠れた切り札です。Windows/Linux は単一 GPU VRAM では強い一方、「昼はノート開発 + 夜は Agent 常時稼働」はリモート Mac レンタルが現実的な選択肢になりがちです。

ローカル 32GB に 72B 事前検査が載らず、すべての tool ターンをクラウドに任せたくない場合、最もクリーンな道はリモート Apple Silicon Mac をレンタルすることです。MACGPU の M3/M4 Max 128GB ノードは OpenClaw Gateway + macMLX をプリインストールでき、IDE とモバイルチャネルが同一 OpenRouter ルート表を共有し、Tool Calls 分榜で「ローカルに載らない」部分を LAN 内で完結させます。

10. 引用可能な数値と FAQ

① OpenRouter 週次処理量(5/26 発表):~25T tokens/週。② Hermes vs OpenClaw 日次 token(約 5/10):224B vs 186B。③ OpenClaw 累計 token(報道口径):~9.17T。④ 中国系モデル OpenRouter シェア(業界分析):>45%。⑤ Agent tool ターン token 倍率(純チャット比):約 3–5×。⑥ ケース請求変化:$4,100 → $2,420(-41%)

Q:総合榜はまだ見るべき?A:はい。ただし Agent ルートは Tool Calls を主とします。Q:Hermes は OpenClaw を置き換える?A:日次榜はトレンド、本番はチャネルと運用——併用可能です。Q:Mac で Tool Calls 首位をローカル実行?A:首位は多く API-only;ローカル 30B は補助です。Q:MACGPU は何を解決?A:リモート 7×24 Gateway + 大容量 MLX、ローカルは管理のみでピークを背負わない。