2026年5月末 OpenRouter Tool Calls と Agent ランキング：Hermes 日次トークンが OpenClaw を逆転 — 25T/週の Mac Agent スタック分流

openrouter.ai/rankings を開くと、2026年5月26日に OpenRouter が Series B $113M を発表し、プラットフォームの週次処理量は約 25T tokens（半年前は約 5T/週）に達しています。ランキングはもはや「誰が最もチャットしているか」だけではありません。総合榜と Programming に加え、Tool Calls、Market Share（ベンダー別）、Agent/App 次元の日次 token が、Mac 上で OpenClaw / Hermes / Cursor Agent を運用する方が注視すべきスライスです。5月10日前後、Hermes Agent の日次 token ~224B が OpenClaw ~186B を初めて上回りましたが、OpenClaw の累計は依然 ~9.17T vs Hermes ~6.35T——これは「日次榜の入れ替わり」であり「エコシステムの交代」ではありません。本稿では分榜の読み方 — Tool Calls スナップショット — Agent 榜の変化 — ベンダー市占 — Mac 三レーン分流 — 六ステップ実装 — 検収チェックリストを順にご説明します。サイト内の《5月総合ランキング意思決定マトリクス》《Programming 分榜》《OpenClaw 429 マルチモデル降格》と役割分担します。

1. 痛点の整理：総合榜は Agent を救わず、Programming 榜も Tool Call を救いません

1）次元のずれ：総合 #1 MiMo-V2-Pro は汎用チャットに強い一方、tool call の安定性を保証しません。Programming 分榜は「コード流量」を測るもので、exec / MCP / ブラウザ / ファイルシステムのツールチェーンではありません。2）Agent ランタイム ≠ ベースモデル：Hermes の日次榜リードは「自己改善 + 永続メモリ」路線の伸びを示しますが、OpenClaw の ClawHub、マルチチャネル、launchd 常駐は依然として本番のデフォルトです——日次榜を追うか累計を追うかで、意思決定は全く異なります。3）Tool Calls はコストが高い：1 Agent ターンに 8–20 回の tool round-trip が含まれることは珍しくなく、同一主モデルでも token は純チャットの 3–5× になり得ます。Gemini Flash と Opus 4.7 を誤選すると、月次請求は桁が変わります。4）Mac ローカルに Agent 主モデルは載らない：Tool Calls 分榜上位は閉源または超大 MoE が多く、OpenRouter API が必須です。ローカルでは 30B 級の「ツール補助モデル」で下書きやフィルタに留まります。5）設定ドリフト：openclaw.json の主モデルと OpenRouter fallback を週次で更新しないと、429 後の fallback 書き戻しで、Agent は先週の榜外モデルを走っていることになります。

2. 5月末の OpenRouter 多次元ランキングの読み方

分榜/スライス	答える問い	Mac ユーザー向け典型アクション
Top Models（総合）	全サイト週 token 首位	日常チャット/API デフォルト（0525 記事参照）
Programming / Python	IDE 補完・リファクタ流量	Cursor/Cline コーディングルート（0526 記事参照）
Tool Calls	tools 付きリクエストの担い手	OpenClaw / Hermes / 自前 Agent の主モデル + fallback
Market Share	ベンダー別 token シェア	「中国系 OSS vs 欧米閉源」のコスト・コンプライアンス評価
Languages / Context / Images / Audio	言語、コンテキスト長、マルチモーダル	RAG 長鎖、ビジュアル Agent の個別ルート
Agent/App 日次 token（公開報道）	最も熱い Agent スタック	Hermes vs OpenClaw vs 純 IDE Agent の選択

5/26 の資金調達稿では、ランキングが投資家・メディアが引用する「real adoption」指標の一つになったと強調されています。実務では、Agent ワークフローは毎週月曜に Tool Calls + Agent 日次榜を揃え、毎月 Market Share を見て「主ベンダーのルート変更」を検討するのがよいでしょう。

3. Tool Calls 分榜スナップショット（2026-05-27 週、Agent ワークフロー視点）

ティア	代表モデル（OpenRouter ID 例）	Tool シーンの強み	Mac パス
T1 高スループット低価格	deepseek/deepseek-v4-flash、google/gemini-3-flash-preview	多段 tool ループ、コスト重視	API のみ；ローカル Qwen3 30B で事前スクリーニング
T2 バランス	anthropic/claude-sonnet-4.6、moonshotai/kimi-k2.6	長鎖 Agent、安定 JSON tool schema	主に API；Kimi 蒸留はリモート Mac
T3 難タスク兜底	anthropic/claude-opus-4.7、openai/gpt-5.5-pro	複雑 MCP、クロスツール推論	API のみ；$/day ハードキャップ設定
T4 OSS 実験	qwen/qwen3.7-max、xiaomi/mimo-v2-pro	監査可能、自前ゲートウェイ	リモート Mac 128GB+ または API

Tool Calls 分榜と Programming 分榜の重複は約 50%–60% ですが、順位は異なります。Gemini 3 Flash Preview は tool シーンで「純プログラミング」榜より高いことが多く、Agent フレームワークが「安価なマルチモーダル tool ワーカー」としてデフォルト設定するためです。OpenClaw ユーザーは openclaw.json で tools.profile と主モデルを分離してください：主モデルは T1/T2、fallback チェーンに T3 を残します。

4. Agent 榜の変局：Hermes 日次 token vs OpenClaw 累計

指標	Hermes Agent	OpenClaw	選び方
日次 token（約 5/10）	~224B	~186B	日次榜：Hermes の熱度が高い
累計 token	~6.35T	~9.17T	エコシステム：OpenClaw が厚い
メモリモデル	三層永続メモリ + SQLite FTS	セッション外付け / MEMORY.md	長期タスクは Hermes 寄り
Mac 本番	新しめのスタック、ドキュメント少	launchd、ClawHub、サイト内 Runbook 多数	7×24 は依然 OpenClaw 多め
モデル入口	主に OpenRouter	OpenRouter + ベンダー直結	いずれも Tool Calls 分榜に揃える

結論：日次榜を追うのは自己改善 Agent の試作向き、累計 + 運用成熟度を追うのは企業 WeChat/Telegram 常駐向きです。Mac 上ではどちらも「Gateway 内のモデルルート」だけ差し替え可能で、二者択一は不要です——Hermes を実験サンドボックス、OpenClaw を本番チャネルとし、同一 OpenRouter key と同一 Tool Calls 主モデルを共有できます。

5. Market Share と 25T/週：Mac 意思決定への意味

公開報道と業界分析は一致しており、中国系モデルの OpenRouter 合計 token シェアは 45%超（1年前は約 2%）に達しています。5/26 以降の週次規模は約 25T tokens です。Market Share 分榜では Google、Anthropic、DeepSeek、Moonshot、Xiaomi などが交替リードし、単一ベンダー >25% の独占はありません——Mac ユーザーにとっては OpenRouter で「ベンダーレベル failover」が可能で、1社 API にロックインされない利点があります。実務では：主ルートに Tool Calls 分榜 T1（DeepSeek V4 Flash / Gemini 3 Flash）、ベンダーバックアップに別社（例：Anthropic Sonnet）を選び、同一クラウド障害ですべての Agent チャネルが止まるのを避けてください。

6. 六ステップ実装：Tool Calls 分榜 → Mac Agent スタック

Step 1 — 毎週 Tool Calls + Agent スナップショットを取得

openrouter.ai/rankings で Tool Calls、Market Share を切り替えて固定アクセスします。API 側は GET /api/v1/models?supported_parameters=tools で pricing と context を保存します。

Step 2 — Agent 負荷を四バケットに分類

軽量 tool（1–3 回） / 標準 Agent（4–10 回） / 重 MCP（10+ 回） / マルチモーダル tool（画像+文）。各バケットに T1–T3 の主・備を1つずつ割り当てます。

Step 3 — OpenClaw：openclaw.json を揃える

主モデルは T1；fallback 配列は T2→T3；tools.profile で高危険 exec を制限；Gateway は https://openrouter.ai/api/v1 を使用します。

Step 4 — Hermes / Cursor Agent：同一 key、異なる runtime

Hermes 実験時も本番と同じ Tool Calls 主モデルを使い、「実験スタックは高価モデル、本番は安価モデル」という比較の歪みを避けます。

Step 5 — ローカル 30B + リモート Mac 128GB

ローカル Qwen3 30B で tool 引数の事前検査；リモート Mac で 72B または Kimi 蒸留を走らせ、SSH トンネルで OpenClaw サブエージェントに供給します。

Step 6 — 30分プローブ + 日次上限

各ルート本番前：tool 付き prompt 10 件で tool 成功率 >90%、p95 ターン <45s を確認；OpenRouter ダッシュボードで $/day hard cap を設定します。

# Tool 対応モデル一覧
curl -s "https://openrouter.ai/api/v1/models" \
  | jq '.data[] | select(.supported_parameters[]? == "tools")
        | {id, pricing, context_length}' \
  > /tmp/or-tools-$(date +%Y%m%d).json

# openclaw.json 断片（主モデル + fallback、示意）
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "deepseek/deepseek-v4-flash",
        "fallbacks": [
          "google/gemini-3-flash-preview",
          "anthropic/claude-sonnet-4.6",
          "anthropic/claude-opus-4.7"
        ]
      }
    }
  }
}

# 日次上限：OpenRouter Dashboard → Limits → daily budget
                

7. 三レーン意思決定マトリクス：ローカル / リモート Mac / OpenRouter API

Agent シーン	パス	代表構成	検収
軽量 tool / 事前検査	ローカル MLX	Qwen3 30B @ 8081	tool JSON 合法率 >95%
チャネル常駐 7×24	リモート Mac + OpenClaw	launchd + OpenRouter T1	24h 無断、429<1%
多段 MCP / ブラウザ	OpenRouter API	V4 Flash → Sonnet → Opus	ターン p95 <60s
Hermes 実験	ローカルまたはリモートサンドボックス	本番と同 T1 モデル	メモリ検索遅延 <500ms
ピーク分流	リモート Mac 128GB	macMLX + サブエージェント	夜間 6h OOM なし

8. 深度ケース：運用チームが Tool Calls 分榜で OpenClaw を再配線し、Agent 月次 token を 41% 削減

「6名の運用チーム。OpenClaw を Telegram + 企業 WeChat に常駐させ、主モデルは Opus 4.7 固定で月次 OpenRouter 請求 $4,100。5月中旬に Tool Calls 分榜に基づき再配線：デフォルト deepseek-v4-flash、Sonnet 4.6 は browser+exec を含むセッションのみ、Opus は手動 /deep-debug のみ。Gateway を MACGPU リモート M4 Max 128GB に移し、ローカル MacBook は SSH 管理のみ。30日後、Agent 月次 token は 820B から 480B に、請求 $2,420、41% 削減；tool 失敗率は 4.2% から 2.1%（ローカル 30B 事前検査追加の効果）。」

本ケースが示すのは、Agent コストの主因は tool ターン数 × 主モデル単価であり、「どの Agent フレームワークを選ぶか」ではないという点です。Hermes の日次榜がどれだけ高くても、ベースが Opus なら請求は爆発します。OpenClaw の累計がどれだけ厚くても、ベースを Tool Calls T1 に替えれば同様に節約できます。リモート Mac の価値はGateway と重負荷をノート PC から切り離すことにあり、7×24 と日中開発が unified memory を奪い合いません。

9. 業界インサイト：Agent 時代のランキングは「ランタイム榜」と「Tool モデル榜」に分裂する

25T tokens/週は、プラットフォームデータが「チャット製品」から「Agent インフラ」へ移行したことを意味します。2026年下半期には二つの平行榜が出現します：最も熱い Agent ランタイム（Hermes、OpenClaw、ベンダー IDE Agent）と最も安定した tool-calling モデル（Flash 系が量を取り、Opus 系が兜底）。Mac の独自性は、同一マシンで Gateway（Node + launchd）、MLX 事前検査、ComfyUI/Whisper を並走できる点にあり、unified memory はマルチ Agent 並列時の隠れた切り札です。Windows/Linux は単一 GPU VRAM では強い一方、「昼はノート開発 + 夜は Agent 常時稼働」はリモート Mac レンタルが現実的な選択肢になりがちです。

ローカル 32GB に 72B 事前検査が載らず、すべての tool ターンをクラウドに任せたくない場合、最もクリーンな道はリモート Apple Silicon Mac をレンタルすることです。MACGPU の M3/M4 Max 128GB ノードは OpenClaw Gateway + macMLX をプリインストールでき、IDE とモバイルチャネルが同一 OpenRouter ルート表を共有し、Tool Calls 分榜で「ローカルに載らない」部分を LAN 内で完結させます。

10. 引用可能な数値と FAQ

① OpenRouter 週次処理量（5/26 発表）：~25T tokens/週。② Hermes vs OpenClaw 日次 token（約 5/10）：224B vs 186B。③ OpenClaw 累計 token（報道口径）：~9.17T。④ 中国系モデル OpenRouter シェア（業界分析）：>45%。⑤ Agent tool ターン token 倍率（純チャット比）：約 3–5×。⑥ ケース請求変化：$4,100 → $2,420（-41%）。

Q：総合榜はまだ見るべき？A：はい。ただし Agent ルートは Tool Calls を主とします。Q：Hermes は OpenClaw を置き換える？A：日次榜はトレンド、本番はチャネルと運用——併用可能です。Q：Mac で Tool Calls 首位をローカル実行？A：首位は多く API-only；ローカル 30B は補助です。Q：MACGPU は何を解決？A：リモート 7×24 Gateway + 大容量 MLX、ローカルは管理のみでピークを背負わない。