OPENROUTER 6月
CHINA_61%_
US_70_TO_30_
H2_BETS.

OpenRouter 2026年6月 AIモデルランキング

6月の締めくくりに、AI界では3つの衝撃が同時に起きました。Claude Fable 5 が輸出規制で全世界から撤退、OpenAI と Anthropic がともに IPO 意向を示唆、そして 中国モデルが OpenRouter のトークントラフィックの60%を突破しました。痛点:開発者は依然として「米国ラボがデフォルトスタックを握る」という去年のメンタルモデルでルーティングしている一方、請求書は DeepSeek・小米・MiniMax に票を投じています。結論:実トラフィックが語るのは経済学の物語です——用量1位≠品質1位。2026年Q3は史上最も密集したフロンティアリリースウィンドウになる可能性があります。構成:会社・モデル双表、米国70%→30%の崩壊、品質vs用量の分離、シナリオ選定表、Q3予測、5ステップルーティング、Mac三層分流。

1. 痛点:2026年6月が昨年の認知フレームを壊す理由

1)ベンチマークは嘘をつくが、請求書は嘘をつかない:OpenRouter は数百万件の本番リクエストをルーティングしており、ランキングはプレスリリースではなくウォレットの投票を反映します。2)最良モデル≠最も使われるモデル:Claude Opus 4.8 は Artificial Analysis で 61.4(#1)ですが、日次トークンは約 200B にとどまり、DeepSeek V4 Flash の 619B を大きく下回ります。3)これは愛国心の話ではない:米国・EU・インドの開発者が中国モデルを選ぶのは、安く、速く、十分に良いからです。4)単一プロバイダールーティングは技術的負債:5つのフロンティアラボが90日以内にリリースする可能性があり、今日の#1が10月も#1とは限りません。

2. 数字で見る:会社・モデルランキング(2026年6月)

2.1 会社別(週間トークン量)

順位会社出身地週間トークンシェア
1DeepSeek中国5.13T17.6%
2Anthropic米国4.34T14.8%
3Google米国3.66T12.5%
4OpenAI米国2.46T8.4%
5Xiaomi中国2.42T8.3%
6MiniMax中国2.37T8.1%
7Tencent中国2.36T8.1%
8Qwen(Alibaba)中国1.26T4.3%

中国系会社:トップ10内で約46%。Moonshot などを含めると、開発者トラフィックシェアは 61% を超えています。

2.2 モデル別日次トークン量 Top 10

順位モデル会社日次トークン
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

3. 大局:米国モデルが1年で70%から30%へ

Bloomberg が引用した OpenRouter + Exponential View のデータは次のとおりです。

  • 2025年6月:米国ラボ(Google + OpenAI + Anthropic)がトークンシェア約 70%
  • 2026年6月:その数字は約 30% まで低下

40ポイントが中国のオープンウェイトモデルへ移動しました。サンディエゴの開発者は率直にこう語っています。

「Claude で1時間コーディングすると約 10ドル。DeepSeek なら 50セント 未満。」

これは能力の話ではなく、少なくとも日常ワークロードの大半にとっては経済学の話です。

4. 用量リーダー vs 品質リーダー

4.1 品質の天井:Claude Opus 4.8 は依然として#1

モデルインテリジェンス指数SWE-bench Pro備考
Claude Opus 4.861.4(#1)69.2%長コンテキストとエージェント
GPT-5.559–6063.1%エコシステム、ツール呼び出し
Gemini 3.1 Pro57最難推論タスク
Qwen 3.7 Max57中国トップ閉源モデル
Claude Sonnet 4.680.8%(Verified)ライティング、指示追従

あるエンジニアが同一20タスクで検証した結果、Opus 4.8 が 16 勝、GPT-5.5 が5勝、Gemini 3.1 Pro が4勝でした。長コンテキスト作業では Opus は別格でした。

Claude Fable 5 は一時的に品質スコア満点 100/100(SWE-bench Verified 約 95%)を記録しましたが、2026年6月中旬に輸出規制で全世界からオフラインになりました。米国の品質天井はアクセス可能な範囲で依然として高いことを示しています。

4.2 用量チャンピオン:中国モデルはコスパで勝つ

  1. 価格:MiniMax M3 は入力 $0.60/M — Claude Opus 4.8($5.00/M)の約 8分の1
  2. 十分な品質:補完・翻訳・要約でフロンティア性能の 80–90%
  3. オープンウェイト:DeepSeek V4、MiniMax M3 — セルフホスト可能、プライバシーに有利

ダラスの開発者のスタック:「難タスクは月 $500 の Claude + ChatGPT、日常コーディングの90%は月 $200 の MiniMax + Kimi + MiMo」

5. シナリオ別モデル選定表(2026年6月版)

ユースケース推奨モデル理由
複雑なコーディング / エージェントClaude Opus 4.8指数#1、長コンテキスト無双
日常開発アシストDeepSeek V4 Flash / MiMo-V2.5コスパ、速度
最低コスト本番APIMiniMax M3$0.60/M、オープンウェイト
超長コンテキスト(1M+)Kimi K2.61Mウィンドウ、競争力ある価格
Google WorkspaceGemini 3.5 Flashネイティブ統合
リアルタイムWeb / XGrok 4.3ライブ取得
セルフホスト / オンプレGLM 5.2 / Kimi K2.6トップオープンウェイト
画像生成 + テキストChatGPT Images 2.0テキスト描画最強
最高の日常チャットGPT-5.5GPT-5.3比ハルシネーション52.5%減

6. 2026年下半期予測:圧縮されたフロンティアリリースウィンドウ

6.1 Q3 2026 高確率リリース

モデル会社時期主なアップグレード
GPT-6OpenAI2026年8–9月1.5Mコンテキスト噂、エージェント強化
Claude Opus 5Anthropic2026年9月前後長期間エージェント、MCP刷新
Gemini 4Google2026年Q3動画・音声・画像マルチモーダル飛躍
DeepSeek V5DeepSeek2026年Q3オープンウェイト、約1Tパラメータ
GLM 5.2Z.aiリリース済みトップオープンウェイトコーディング
Grok 4.3+xAI2026年Q31Mコンテキスト、リアルタイムWeb

6.2 5つのマクロ予測

1. 「最良モデル」という概念は無用になる — タスク複雑度とコストでモデル非依存ルーティングを構築します。

2. 中国の用量シェアは伸び続けるが、エンタープライズコンプライアンスが天井(個人70%+ vs Fortune 500 30%未満)。

3. エージェント信頼性がエンタープライズ指標 — Anthropic 2026エージェント報告によると Claude API 使用量の 44% が数学・コンピュータタスクです。

4. OpenAI と Anthropic の IPO 圧力(ともに2026年6月に示唆)が段階価格と価格戦争を加速する可能性があります。

5. 32GBコンシューマGPU上のローカルモデルが2027年半ばまでに SWE-bench Verified 80% に到達 — 日常コーディングAPIを根本から揺るがします。

7. 5ステップ:入れ替え可能な OpenRouter ルーティング層の構築

  1. シナリオ別にチェーンを分割:Cursor、OpenClaw、LiteLLM でエージェント・補完・バッチ要約に単一デフォルトモデルを使わない。
  2. Opus 4.8 に日次予算を設定:超過時は DeepSeek V4 Flash または MiMo-V2.5 へ自動フォールバック。
  3. openrouter.ai/rankings を週次で確認 — 急上昇モデルはプレビュー価格終了が多い。移行を事前計画。
  4. Mac で MLX ローカルバックアップ:輸出規制・レート制限対策に GLM 5.2 / Kimi K2.6 / DeepSeek V4。
  5. 回帰スイート:同一20タスクを Opus、DeepSeek Flash、MiMo で実行し、合格率とコストをチームSOPに記録。

8. ケーススタディ:マージン圧縮が米国ラボ戦略を再形成

構造的故事は「中国が勝った」ではなく、モデル層の経済マージンが崩壊していることです。

  • OpenAI:エコシステム深度(プラグイン、エンタープライズ、Codex Mobile)
  • Anthropic:品質天井の防衛 — Opus は最難エージェント評価で依然勝利
  • Google:マルチモーダル幅と速度 — Gemini Flash は閉源フロンティアで最高コスパ

中間層——「Claudeほどではないが、安くもない」——は空洞化しています。good-enough はプレミアムの 8–30倍安く、本番負荷の90%を処理します。

最も価値あるスキルは最良モデルを選ぶことではなく、アプリを書き直さずにモデルを入れ替えられるアーキテクチャを構築することです。

9. まとめ:OpenRouter ルーティング + Mac 統一メモリ三層分流

Windows/Linux クラウドでも OpenRouter は呼べますが、ローカル MLX 推論、Cursor ツールチェーン連携、24/7 エージェント、グラフィックスワークフローでは Apple Silicon Mac に及びません。Claude 10ドル/時 vs DeepSeek 0.50ドル/時の差に揺さぶられているなら、三層スタックを推奨します。ローカル MLXで GLM 5.2 / Kimi オープンウェイトを日常量に、OpenRouter APIで最難5%に Opus 4.8、MACGPU リモート Mac ノードで夜間バッチエージェントと長コンテキストオフロード。Q3リリース嵐の前に、予測可能なコンピュートが最良のヘッジです。