OPENROUTER 6월
CHINA_61%_
US_70_TO_30_
H2_BETS.
6월 말, AI 업계에 세 가지 충격이 동시에 터졌습니다. Claude Fable 5가 수출 규제로 전 세계에서 철수, OpenAI와 Anthropic이 모두 IPO 의향을 시사, 그리고 중국 모델이 OpenRouter 토큰 트래픽의 60%를 돌파했습니다. 핵심 과제: 개발자들은 여전히 '미국 랩이 기본 스택을 소유한다'는 작년의 멘탈 모델로 라우팅하지만, 청구서는 DeepSeek, Xiaomi, MiniMax에 표를 던지고 있습니다. 결론: 실제 트래픽이 말해 주는 것은 경제학 이야기입니다 — 사용량 1위 ≠ 품질 1위. 2026년 Q3는 역대 가장 밀집된 프론티어 릴리스 윈도우가 될 수 있습니다. 구성: 회사·모델 이중 표, 미국 70%→30% 붕괴, 품질 vs 사용량 분리, 시나리오 선정표, Q3 예측, 5단계 라우팅, Mac 3단 분류.
1. 핵심 과제: 2026년 6월이 작년의 인지 프레임을 깨는 이유
1) 벤치마크는 거짓말하지만, 청구서는 거짓말하지 않습니다: OpenRouter는 수백만 건의 프로덕션 요청을 라우팅하며, 랭킹은 보도자료가 아닌 지갑 투표를 반영합니다. 2) 최고 모델 ≠ 가장 많이 쓰이는 모델: Claude Opus 4.8은 Artificial Analysis에서 61.4(#1)이지만, 일일 토큰은 약 200B에 그치며 DeepSeek V4 Flash의 619B를 크게 밑돕니다. 3) 이것은 애국심 이야기가 아닙니다: 미국·EU·인도 개발자가 중국 모델을 선택하는 이유는 저렴하고, 빠르고, 충분히 좋기 때문입니다. 4) 단일 프로바이더 라우팅은 기술 부채: 5개 프론티어 랩이 90일 안에 출시할 수 있으며, 오늘의 1위가 10월에도 1위라는 보장은 없습니다.
2. 숫자로 보는: 회사·모델 랭킹 (2026년 6월)
2.1 회사별 (주간 토큰량)
| 순위 | 회사 | 출신 | 주간 토큰 | 점유율 |
|---|---|---|---|---|
| 1 | DeepSeek | 중국 | 5.13T | 17.6% |
| 2 | Anthropic | 미국 | 4.34T | 14.8% |
| 3 | 미국 | 3.66T | 12.5% | |
| 4 | OpenAI | 미국 | 2.46T | 8.4% |
| 5 | Xiaomi | 중국 | 2.42T | 8.3% |
| 6 | MiniMax | 중국 | 2.37T | 8.1% |
| 7 | Tencent | 중국 | 2.36T | 8.1% |
| 8 | Qwen (Alibaba) | 중국 | 1.26T | 4.3% |
중국계 회사: 상위 10위 내 약 46%. Moonshot 등을 포함하면 개발자 트래픽 점유율은 61%를 넘어섭니다.
2.2 모델별 일일 토큰량 Top 10
| 순위 | 모델 | 회사 | 일일 토큰 |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
3. 큰 그림: 미국 모델이 1년 만에 70%에서 30%로
Bloomberg가 인용한 OpenRouter + Exponential View 데이터는 다음과 같습니다.
- 2025년 6월: 미국 랩(Google + OpenAI + Anthropic)이 토큰 점유율 약 70%
- 2026년 6월: 그 수치는 약 30%로 하락
40포인트가 중국 오픈웨이트 모델로 이동했습니다. 샌디에이고 개발자의 말이 이를 잘 보여 줍니다.
"Claude로 1시간 코딩하면 약 10달러. DeepSeek은 50센트 미만."
이것은 능력의 이야기가 아니라, 적어도 일상 워크로드 대부분에 대해서는 경제학의 이야기입니다.
4. 사용량 리더 vs 품질 리더
4.1 품질 천장: Claude Opus 4.8은 여전히 #1
| 모델 | 인텔리전스 지수 | SWE-bench Pro | 비고 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4 (#1) | 69.2% | 장문맥·에이전트 |
| GPT-5.5 | 59–60 | 63.1% | 에코시스템, 도구 호출 |
| Gemini 3.1 Pro | 57 | — | 최난도 추론 |
| Qwen 3.7 Max | 57 | — | 중국 최고 폐쇄 모델 |
| Claude Sonnet 4.6 | — | 80.8% (Verified) | 글쓰기, 지시 따르기 |
한 엔지니어가 동일 20개 태스크로 검증한 결과, Opus 4.8이 16승, GPT-5.5가 5승, Gemini 3.1 Pro가 4승이었습니다. 장문맥 작업에서 Opus는 별종이었습니다.
Claude Fable 5는 일시적으로 품질 점수 만점 100/100(SWE-bench Verified 약 95%)을 기록했으나, 2026년 6월 중순 수출 규제로 전 세계에서 오프라인되었습니다. 미국의 품질 천장은 접근 가능한 범위에서 여전히 높음을 보여 줍니다.
4.2 사용량 챔피언: 중국 모델은 가성비로 승리
- 가격: MiniMax M3 입력 $0.60/M — Claude Opus 4.8($5.00/M)의 약 8분의 1
- 충분한 품질: 완성·번역·요약에서 프론티어 성능의 80–90%
- 오픈웨이트: DeepSeek V4, MiniMax M3 — 셀프호스트 가능, 프라이버시 유리
댈러스 개발자의 스택: "어려운 태스크는 월 $500 Claude + ChatGPT, 일상 코딩 90%는 월 $200 MiniMax + Kimi + MiMo"
5. 시나리오별 모델 선정표 (2026년 6월판)
| 유스케이스 | 추천 모델 | 이유 |
|---|---|---|
| 복잡한 코딩 / 에이전트 | Claude Opus 4.8 | 지수 #1, 장문맥 무적 |
| 일상 개발 보조 | DeepSeek V4 Flash / MiMo-V2.5 | 가성비, 속도 |
| 최저 비용 프로덕션 API | MiniMax M3 | $0.60/M, 오픈웨이트 |
| 초장문맥 (1M+) | Kimi K2.6 | 1M 윈도우, 경쟁력 있는 가격 |
| Google Workspace | Gemini 3.5 Flash | 네이티브 통합 |
| 실시간 Web / X | Grok 4.3 | 라이브 검색 |
| 셀프호스트 / 온프레미스 | GLM 5.2 / Kimi K2.6 | 최고 오픈웨이트 |
| 이미지 생성 + 텍스트 | ChatGPT Images 2.0 | 텍스트 렌더링 최강 |
| 최고의 일상 채팅 | GPT-5.5 | GPT-5.3 대비 환각 52.5% 감소 |
6. 2026년 하반기 예측: 압축된 프론티어 릴리스 윈도우
6.1 Q3 2026 고확률 릴리스
| 모델 | 회사 | 시기 | 주요 업그레이드 |
|---|---|---|---|
| GPT-6 | OpenAI | 2026년 8–9월 | 1.5M 컨텍스트 루머, 에이전트 강화 |
| Claude Opus 5 | Anthropic | 2026년 9월 전후 | 장기 에이전트, MCP 리프레시 |
| Gemini 4 | 2026년 Q3 | 영상·음성·이미지 멀티모달 도약 | |
| DeepSeek V5 | DeepSeek | 2026년 Q3 | 오픈웨이트, 약 1T 파라미터 |
| GLM 5.2 | Z.ai | 출시 완료 | 최고 오픈웨이트 코딩 |
| Grok 4.3+ | xAI | 2026년 Q3 | 1M 컨텍스트, 실시간 Web |
6.2 5가지 거시 예측
1. '최고 모델' 개념은 무용해집니다 — 태스크 복잡도와 비용으로 모델 비의존 라우팅을 구축하세요.
2. 중국 사용량 점유율은 계속 성장하지만, 엔터프라이즈 컴플라이언스가 천장입니다(개인 70%+ vs Fortune 500 30% 미만).
3. 에이전트 신뢰성이 엔터프라이즈 지표 — Anthropic 2026 에이전트 보고서에 따르면 Claude API 사용량의 44%가 수학·컴퓨터 태스크입니다.
4. OpenAI와 Anthropic의 IPO 압력(둘 다 2026년 6월 시사)이 단계별 가격과 가격 전쟁을 가속할 수 있습니다.
5. 32GB 컨슈머 GPU의 로컬 모델이 2027년 중반까지 SWE-bench Verified 80%에 도달 — 일상 코딩 API를 근본적으로 흔듭니다.
7. 5단계: 교체 가능한 OpenRouter 라우팅 레이어 구축
- 시나리오별 체인 분리: Cursor, OpenClaw, LiteLLM에서 에이전트·완성·배치 요약에 단일 기본 모델을 쓰지 마세요.
- Opus 4.8에 일일 예산 설정: 초과 시 DeepSeek V4 Flash 또는 MiMo-V2.5로 자동 폴백.
- openrouter.ai/rankings 주간 확인 — 급상승 모델은 프리뷰 가격 종료가 많습니다. 마이그레이션을 사전 계획하세요.
- Mac에서 MLX 로컬 백업: 수출 규제·레이트 리밋 대비 GLM 5.2 / Kimi K2.6 / DeepSeek V4.
- 회귀 스위트: 동일 20개 태스크를 Opus, DeepSeek Flash, MiMo에서 실행하고 합격률과 비용을 팀 SOP에 기록하세요.
8. 사례 연구: 마진 압축이 미국 랩 전략을 재편
구조적 이야기는 '중국이 이겼다'가 아니라, 모델 레이어의 경제 마진이 붕괴하고 있다는 것입니다.
- OpenAI: 에코시스템 깊이(플러그인, 엔터프라이즈, Codex Mobile)
- Anthropic: 품질 천장 방어 — Opus는 최난도 에이전트 평가에서 여전히 승리
- Google: 멀티모달 폭과 속도 — Gemini Flash는 폐쇄 프론티어 중 최고 가성비
중간층 — 'Claude만큼은 아니지만 저렴하지도 않은' — 은 공허화되고 있습니다. good-enough는 프리미엄보다 8–30배 저렴하며, 프로덕션 부하의 90%를 처리합니다.
가장 가치 있는 스킬은 최고 모델을 고르는 것이 아니라, 앱을 다시 쓰지 않고 모델을 교체할 수 있는 아키텍처를 만드는 것입니다.
9. 마무리: OpenRouter 라우팅 + Mac 통합 메모리 3단 분류
Windows/Linux 클라우드에서도 OpenRouter를 호출할 수 있지만, 로컬 MLX 추론, Cursor 툴체인 시너지, 24/7 에이전트, 그래픽 워크플로에서는 Apple Silicon Mac에 미치지 못합니다. Claude 시간당 10달러 vs DeepSeek 0.50달러의 차이에 흔들린다면, 3단 스택을 권장합니다. 로컬 MLX로 GLM 5.2 / Kimi 오픈웨이트를 일상량에, OpenRouter API로 최난 5%에 Opus 4.8, MACGPU 원격 Mac 노드로 야간 배치 에이전트와 장문맥 오프로드. Q3 릴리스 폭풍 전에 예측 가능한 컴퓨트가 최선의 헤지입니다.