OPENROUTER 6月
CHINA_61%_
US_70_TO_30_
H2_BETS.
6月の締めくくりに、AI界では3つの衝撃が同時に起きました。Claude Fable 5 が輸出規制で全世界から撤退、OpenAI と Anthropic がともに IPO 意向を示唆、そして 中国モデルが OpenRouter のトークントラフィックの60%を突破しました。痛点:開発者は依然として「米国ラボがデフォルトスタックを握る」という去年のメンタルモデルでルーティングしている一方、請求書は DeepSeek・小米・MiniMax に票を投じています。結論:実トラフィックが語るのは経済学の物語です——用量1位≠品質1位。2026年Q3は史上最も密集したフロンティアリリースウィンドウになる可能性があります。構成:会社・モデル双表、米国70%→30%の崩壊、品質vs用量の分離、シナリオ選定表、Q3予測、5ステップルーティング、Mac三層分流。
1. 痛点:2026年6月が昨年の認知フレームを壊す理由
1)ベンチマークは嘘をつくが、請求書は嘘をつかない:OpenRouter は数百万件の本番リクエストをルーティングしており、ランキングはプレスリリースではなくウォレットの投票を反映します。2)最良モデル≠最も使われるモデル:Claude Opus 4.8 は Artificial Analysis で 61.4(#1)ですが、日次トークンは約 200B にとどまり、DeepSeek V4 Flash の 619B を大きく下回ります。3)これは愛国心の話ではない:米国・EU・インドの開発者が中国モデルを選ぶのは、安く、速く、十分に良いからです。4)単一プロバイダールーティングは技術的負債:5つのフロンティアラボが90日以内にリリースする可能性があり、今日の#1が10月も#1とは限りません。
2. 数字で見る:会社・モデルランキング(2026年6月)
2.1 会社別(週間トークン量)
| 順位 | 会社 | 出身地 | 週間トークン | シェア |
|---|---|---|---|---|
| 1 | DeepSeek | 中国 | 5.13T | 17.6% |
| 2 | Anthropic | 米国 | 4.34T | 14.8% |
| 3 | 米国 | 3.66T | 12.5% | |
| 4 | OpenAI | 米国 | 2.46T | 8.4% |
| 5 | Xiaomi | 中国 | 2.42T | 8.3% |
| 6 | MiniMax | 中国 | 2.37T | 8.1% |
| 7 | Tencent | 中国 | 2.36T | 8.1% |
| 8 | Qwen(Alibaba) | 中国 | 1.26T | 4.3% |
中国系会社:トップ10内で約46%。Moonshot などを含めると、開発者トラフィックシェアは 61% を超えています。
2.2 モデル別日次トークン量 Top 10
| 順位 | モデル | 会社 | 日次トークン |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
3. 大局:米国モデルが1年で70%から30%へ
Bloomberg が引用した OpenRouter + Exponential View のデータは次のとおりです。
- 2025年6月:米国ラボ(Google + OpenAI + Anthropic)がトークンシェア約 70%
- 2026年6月:その数字は約 30% まで低下
40ポイントが中国のオープンウェイトモデルへ移動しました。サンディエゴの開発者は率直にこう語っています。
「Claude で1時間コーディングすると約 10ドル。DeepSeek なら 50セント 未満。」
これは能力の話ではなく、少なくとも日常ワークロードの大半にとっては経済学の話です。
4. 用量リーダー vs 品質リーダー
4.1 品質の天井:Claude Opus 4.8 は依然として#1
| モデル | インテリジェンス指数 | SWE-bench Pro | 備考 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4(#1) | 69.2% | 長コンテキストとエージェント |
| GPT-5.5 | 59–60 | 63.1% | エコシステム、ツール呼び出し |
| Gemini 3.1 Pro | 57 | — | 最難推論タスク |
| Qwen 3.7 Max | 57 | — | 中国トップ閉源モデル |
| Claude Sonnet 4.6 | — | 80.8%(Verified) | ライティング、指示追従 |
あるエンジニアが同一20タスクで検証した結果、Opus 4.8 が 16 勝、GPT-5.5 が5勝、Gemini 3.1 Pro が4勝でした。長コンテキスト作業では Opus は別格でした。
Claude Fable 5 は一時的に品質スコア満点 100/100(SWE-bench Verified 約 95%)を記録しましたが、2026年6月中旬に輸出規制で全世界からオフラインになりました。米国の品質天井はアクセス可能な範囲で依然として高いことを示しています。
4.2 用量チャンピオン:中国モデルはコスパで勝つ
- 価格:MiniMax M3 は入力 $0.60/M — Claude Opus 4.8($5.00/M)の約 8分の1
- 十分な品質:補完・翻訳・要約でフロンティア性能の 80–90%
- オープンウェイト:DeepSeek V4、MiniMax M3 — セルフホスト可能、プライバシーに有利
ダラスの開発者のスタック:「難タスクは月 $500 の Claude + ChatGPT、日常コーディングの90%は月 $200 の MiniMax + Kimi + MiMo」
5. シナリオ別モデル選定表(2026年6月版)
| ユースケース | 推奨モデル | 理由 |
|---|---|---|
| 複雑なコーディング / エージェント | Claude Opus 4.8 | 指数#1、長コンテキスト無双 |
| 日常開発アシスト | DeepSeek V4 Flash / MiMo-V2.5 | コスパ、速度 |
| 最低コスト本番API | MiniMax M3 | $0.60/M、オープンウェイト |
| 超長コンテキスト(1M+) | Kimi K2.6 | 1Mウィンドウ、競争力ある価格 |
| Google Workspace | Gemini 3.5 Flash | ネイティブ統合 |
| リアルタイムWeb / X | Grok 4.3 | ライブ取得 |
| セルフホスト / オンプレ | GLM 5.2 / Kimi K2.6 | トップオープンウェイト |
| 画像生成 + テキスト | ChatGPT Images 2.0 | テキスト描画最強 |
| 最高の日常チャット | GPT-5.5 | GPT-5.3比ハルシネーション52.5%減 |
6. 2026年下半期予測:圧縮されたフロンティアリリースウィンドウ
6.1 Q3 2026 高確率リリース
| モデル | 会社 | 時期 | 主なアップグレード |
|---|---|---|---|
| GPT-6 | OpenAI | 2026年8–9月 | 1.5Mコンテキスト噂、エージェント強化 |
| Claude Opus 5 | Anthropic | 2026年9月前後 | 長期間エージェント、MCP刷新 |
| Gemini 4 | 2026年Q3 | 動画・音声・画像マルチモーダル飛躍 | |
| DeepSeek V5 | DeepSeek | 2026年Q3 | オープンウェイト、約1Tパラメータ |
| GLM 5.2 | Z.ai | リリース済み | トップオープンウェイトコーディング |
| Grok 4.3+ | xAI | 2026年Q3 | 1Mコンテキスト、リアルタイムWeb |
6.2 5つのマクロ予測
1. 「最良モデル」という概念は無用になる — タスク複雑度とコストでモデル非依存ルーティングを構築します。
2. 中国の用量シェアは伸び続けるが、エンタープライズコンプライアンスが天井(個人70%+ vs Fortune 500 30%未満)。
3. エージェント信頼性がエンタープライズ指標 — Anthropic 2026エージェント報告によると Claude API 使用量の 44% が数学・コンピュータタスクです。
4. OpenAI と Anthropic の IPO 圧力(ともに2026年6月に示唆)が段階価格と価格戦争を加速する可能性があります。
5. 32GBコンシューマGPU上のローカルモデルが2027年半ばまでに SWE-bench Verified 80% に到達 — 日常コーディングAPIを根本から揺るがします。
7. 5ステップ:入れ替え可能な OpenRouter ルーティング層の構築
- シナリオ別にチェーンを分割:Cursor、OpenClaw、LiteLLM でエージェント・補完・バッチ要約に単一デフォルトモデルを使わない。
- Opus 4.8 に日次予算を設定:超過時は DeepSeek V4 Flash または MiMo-V2.5 へ自動フォールバック。
- openrouter.ai/rankings を週次で確認 — 急上昇モデルはプレビュー価格終了が多い。移行を事前計画。
- Mac で MLX ローカルバックアップ:輸出規制・レート制限対策に GLM 5.2 / Kimi K2.6 / DeepSeek V4。
- 回帰スイート:同一20タスクを Opus、DeepSeek Flash、MiMo で実行し、合格率とコストをチームSOPに記録。
8. ケーススタディ:マージン圧縮が米国ラボ戦略を再形成
構造的故事は「中国が勝った」ではなく、モデル層の経済マージンが崩壊していることです。
- OpenAI:エコシステム深度(プラグイン、エンタープライズ、Codex Mobile)
- Anthropic:品質天井の防衛 — Opus は最難エージェント評価で依然勝利
- Google:マルチモーダル幅と速度 — Gemini Flash は閉源フロンティアで最高コスパ
中間層——「Claudeほどではないが、安くもない」——は空洞化しています。good-enough はプレミアムの 8–30倍安く、本番負荷の90%を処理します。
最も価値あるスキルは最良モデルを選ぶことではなく、アプリを書き直さずにモデルを入れ替えられるアーキテクチャを構築することです。
9. まとめ:OpenRouter ルーティング + Mac 統一メモリ三層分流
Windows/Linux クラウドでも OpenRouter は呼べますが、ローカル MLX 推論、Cursor ツールチェーン連携、24/7 エージェント、グラフィックスワークフローでは Apple Silicon Mac に及びません。Claude 10ドル/時 vs DeepSeek 0.50ドル/時の差に揺さぶられているなら、三層スタックを推奨します。ローカル MLXで GLM 5.2 / Kimi オープンウェイトを日常量に、OpenRouter APIで最難5%に Opus 4.8、MACGPU リモート Mac ノードで夜間バッチエージェントと長コンテキストオフロード。Q3リリース嵐の前に、予測可能なコンピュートが最良のヘッジです。