2026 OPENROUTER
CLI_TOP_
APPS_
MAC_PICK.
GitHub Stars 会骗人,但 OpenRouter Top Apps 上每周结算的 Token 不会。痛点:Mac 开发者在 Hermes Agent、Kilo Code、Claude Code、Aider、Cline 之间摇摆,却分不清「模型榜」与「应用榜」——前者告诉你该接哪个 LLM,后者才反映哪条 Agent 栈真在被重度使用。结论:2026 年 6 月第一周,Hermes Agent 4.94T 全平台第一,Kilo Code 1.22T 与 Claude Code 606B 挤进 Top 5;CLI+Agent 类工具合计吃掉本周约 70%+ Token。结构预告:应用榜读法 → 全平台快照 → CLI Top 10 → 功能矩阵 → 场景选型 → 五步落地 → 案例 → Mac 租赁决策。
1. 痛点拆解:应用榜 vs 模型榜,别再看错表
1)模型榜回答「接谁」:OpenRouter rankings 里的 Top Models、Programming Collections 告诉你 DeepSeek-V4-Flash、Hy3 preview 等模型谁被调用最多——适合写进 openclaw.json 或 Cursor 的 fallback 链(详见周 Token 榜解读)。2)应用榜回答「用哪款工具」:openrouter.ai/apps 记录的是已接入并公开追踪的客户端——Hermes、Kilo Code、Claude Code 各自消耗多少 Token,反映的是运行时 + 工作流的真实渗透率。3)Stars ≠ 用量:OpenCode 有 97,500+ Stars 增速最快,但 OpenRouter 本周榜外;Aider 41,200+ Stars 极成熟,周 Token 却远低于交互式 Agent——自动化批量任务与「边写边聊」模式 Token 曲线完全不同。4)Mac 特殊性:Claude Code 的 macOS Seatbelt 沙箱、Goose 的 Rust 在 Apple Silicon 上的性能、Kilo Code 与 VS Code 在 macOS 文件权限上的配合——榜单前列工具与 Mac 存在天然绑定,选型必须叠加硬件维度。
2. 数据来源:2026/6/2–6/8 本周快照
统计口径:OpenRouter 官方 Top Apps 页面「This Week」维度(自然周周一至周日),截至 2026 年 6 月 8 日。仅包含选择公开追踪的应用,非全样本,但覆盖主流 CLI/IDE Agent。CLI 专项榜在全平台数据基础上,结合近 30 日累计、终端可用性、MCP/沙箱能力、开源状态与社区活跃度综合排序;纯娱乐类应用(Janitor AI 等)不计入 CLI 专项。
3. 全平台 Top 10:CLI 双雄进前五
| 排名 | 应用 | 类型 | 本周 Token | 备注 |
|---|---|---|---|---|
| 1 | Hermes Agent | AI Agent(CLI) | 4.94T | 全平台第一,开源零门槛 |
| 2 | OpenClaw | 通用 Agent | 1.26T | IM 自动化,Mac 常驻热门 |
| 3 | Kilo Code | CLI / IDE 插件 | 1.22T | 500+ 模型,四种工作模式 |
| 4 | Claude Code | 终端原生 CLI | 606B | 闭源推理天花板 |
| 5 | Descript | 音视频编辑 | 454B | 非开发类,说明平台覆盖面扩大 |
| 6–10 | pi / Lemonade / Pioneer 等 | 混合 | 218B–384B | CLI 类本周仅 Hermes/Kilo/Claude 进 Top 5 |
关键趋势:CLI 与 Agent 类工具合计约 70%+ 本周 Token;Hermes 单应用 4.94T 约为第二名 OpenClaw(1.26T)的近 4 倍——大量自动化脚本、研究实验与批量任务在开源 Agent 上爆发,与 IDE 内「边聊边改」的交互模式形成两极。
4. CLI 专项 Top 10 速览
| CLI 排名 | 工具 | 全平台本周 | 本周/月 Token | 开源 | 核心亮点 |
|---|---|---|---|---|---|
| 1 | Kilo Code | #3 | 1.22T | ✅ | 500+ 模型,Architect/Code/Debug/Orchestrator |
| 2 | Claude Code | #4 | 606B | ❌ | Sub-agent、Seatbelt 沙箱、Plan Mode |
| 3 | Hermes Agent | #1 | 4.94T | ✅ | 完全开源,跨会话记忆,自动化渗透极深 |
| 4 | Aider | 榜外 | ~2.4B/月 | ✅ | Git 原生,Tree-sitter Repo Map |
| 5 | Cline | 榜外 | ~140B/月 | ✅ | 逐步审批,浏览器自动化 |
| 6 | Goose | 榜外 | ~46.4B/月 | ✅ | MCP 原生 1700+ 服务,Recipes 工作流 |
| 7 | OpenCode | 榜外 | 快速增长 | ✅ | 75+ 提供商,Docker 沙箱 |
| 8 | OpenAI Codex CLI | 榜外 | ~91B/月 | ✅ | 云端沙箱,高速 Codex 模型 |
| 9 | Roo Code | 榜外 | ~111.8B/月 | ✅ | Cline 增强 Fork,Boomerang 任务 |
| 10 | Qwen Code | 榜外 | ~39.9M/月 | ✅ | 中英双语,Qwen2.5-Coder 深度集成 |
5. 横向功能矩阵:五维硬指标
| 能力 | Kilo | Claude Code | Hermes | Aider | Cline | Goose | OpenCode |
|---|---|---|---|---|---|---|---|
| MCP | ✅ | ✅ | ✅ | ❌ | ✅ | ✅✅ | ✅ |
| 沙箱隔离 | ❌ | ✅ Seatbelt | ❌ | ❌ | 快照 | Docker | Docker |
| Sub-agent | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
| 免费 BYOK | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 模型数量 | 500+ | Claude only | 多模型 | 100+ | 全平台 | 多模型 | 75+ |
读表口诀:要模型自由选 Kilo;要推理与安全选 Claude Code;要零成本自动化选 Hermes;要Git 历史整洁选 Aider;要逐步审计选 Cline;要企业工具链选 Goose。
6. 七大场景选型指南
场景 A · Git 历史整洁 → Aider:每次修改自动 commit,Architect 模式用强模型规划、弱模型实现降本。场景 B · 大型重构 + 预算充足 → Claude Code:Sub-agent 并行,SWE-bench 持续领先,约占 GitHub AI 辅助提交 4%。场景 C · 最大模型灵活性 → Kilo Code:OpenRouter 一键切换,本周 1.22T 证明使用深度。场景 D · 安全审计 → Cline:每步确认 + Checkpoint 回滚。场景 E · DevOps 编排 → Goose:Recipes + MCP 接 Jira/GitHub/Slack。场景 F · 预算有限 → Hermes Agent 或 Gemini CLI(后者注意 6 月政策,见Gemini CLI 争议文)。场景 G · 中文开发 → Qwen Code + Qwen2.5-Coder。
7. 五步落地:把应用榜写进 Mac 工作流
Step 1 — 每周一打开 openrouter.ai/apps,存档 CLI 分类 diff
重点关注 category/coding/cli-agent 名次变化;Hermes/Kilo 周环比 >20% 时检查是否该调整本机 Agent 常驻策略。
Step 2 — 拆「运行时」与「模型路由」两层配置
运行时选 Hermes/OpenClaw/Kilo;模型层仍按 Programming Collections 周更——两层勿混写在一个配置文件里。
Step 3 — 标注 Mac 三档:本机 / OpenRouter API / 远程 Mac
轻量 Aider/Hermes → 本机 16GB Air;Kilo+Cline 浏览器自动化 → M3 Pro 32GB;Goose+Docker 沙箱 → 远程 Mac mini M4 Pro 32GB+。
Step 4 — 设 Agent Token 预算与 Headless CI 隔离
Claude Code Pro $20/月 起 + 按量;开源 BYOK 工具设月度 OpenRouter 硬顶(如 $500),超限自动切 DeepSeek-V4-Flash。
Step 5 — 20 任务验收:同一需求跑三条栈对照
各用 Hermes、Kilo Code、Claude Code 完成相同 refactor/issue,记录耗时、$/任务、回滚次数——比读榜更可靠。
8. Mac 租赁配置决策表
| 使用场景 | 推荐配置 | 典型工具栈 | 说明 |
|---|---|---|---|
| 轻量 CLI | MacBook Air M2/M3 16GB | Aider、Hermes | 主要依赖云端 API,本机算力要求低 |
| 中等强度 | MacBook Pro M3 16–32GB | Kilo Code、Cline | 多文件并发 + 浏览器自动化吃内存 |
| 重度沙箱 | Mac mini M4 Pro 32GB+ | Goose、OpenCode Docker | 并行 Agent + 容器 I/O 压力大 |
| 本地模型兜底 | Mac Studio M4 Ultra 64GB+ | Ollama + OpenCode | 7B/14B 本地推理统一内存门槛 |
9. 深度案例:为什么 CLI 工具吃掉 70%+ Token,Mac 成事实标准平台
「一家 8 人远程团队原在 Windows + WSL 上混跑 Goose 与 Cline,OpenRouter 账单月超 $4,100,且 Docker 沙箱在 NTFS 挂载盘上 I/O 抖动严重。对照 6 月第一周应用榜后:① Gateway 级任务迁到 Hermes Agent(自动化占 Token 大头,交互改 Kilo Code);② 模型层 58% 切 DeepSeek-V4-Flash;③ 全员换租 MACGPU M4 Pro 32GB 远程节点跑 Goose Docker + launchd 常驻 Hermes。四周后 Agent 相关 Token 降 31%,P95 沙箱启动从 42s 降到 11s,本机 Windows 只留 Cursor 审阅——案例说明:榜单选栈 + 硬件分层 比单纯换模型更有效。」
行业洞察:OpenRouter 应用榜揭示的不仅是「哪款 CLI 更火」,而是 Agent 化开发已进入规模化消耗阶段——Hermes 4.94T 背后是个体开发者、研究机构与自动化流水线的大规模部署;Kilo 1.22T 说明「多模型 IDE Agent」已从极客玩具变成日常生产力;Claude Code 606B 虽少于 Hermes,但 ARPU 更高,印证「质量轨」与「流量轨」并存。Apple Silicon 统一内存让「本机 Ollama 兜底 + 云端 Agent」并存成为可能;macOS Seatbelt 让 Claude Code 的安全叙事在 Mac 上可验证——这正是 Mac 成为 AI 编程事实标准平台的技术原因,而非品牌迷信。
10. 可引用数字与验收清单
① Hermes Agent 本周:4.94T(全平台 #1)。② Kilo Code:1.22T(#3)。③ Claude Code:606B(#4)。④ CLI+Agent 类合计:约 70%+ 本周 Token。⑤ Aider 安装量:4.1M+;Cline Stars:58,600+。⑥ Claude Code 占 GitHub AI 辅助提交约 4%。
验收清单: 应用榜 CLI 分类已截图 □ | 运行时与模型层配置已拆分 □ | Mac 三档分流已标注 □ | BYOK 月度预算上限 □ | 20 任务三栈对照 □ | Docker 沙箱节点内存 ≥32GB □ | 远程 Mac launchd 常驻 □
纯 Windows 或 Linux 同样能跑上述 CLI,但在与 Xcode/Final Cut/ComfyUI 并行、Claude Code Seatbelt 沙箱、launchd 7×24 常驻 Hermes/OpenClaw、Metal 侧车 MLX 验证的一体化工作流上,macOS 仍更顺滑。若你已在 Mac 上试跑 Goose/OpenCode 的 Docker 沙箱或多 Agent 并行,但本机 16GB 被容器占满、温控降频或无法夜间常驻——MACGPU 远程 Mac 节点(M3 Pro 32GB / Mac mini M4 Pro)可专跑 Agent 与 Headless CI,本机只保留 Kilo/Cursor 审阅与 Dollar 轨推理,用租赁算力换可预测的月费与稳定吞吐。