2026 OPENROUTER
CLI_TOP_
APPS_
MAC_PICK.
GitHub Stars 會騙人,但 OpenRouter Top Apps 上每週結算的 Token 不會。痛點:Mac 開發者在 Hermes Agent、Kilo Code、Claude Code、Aider、Cline 之間搖擺,卻分不清「模型榜」與「應用榜」——前者告訴你該接哪個 LLM,後者才反映哪條 Agent 棧真在被重度使用。結論:2026 年 6 月第一週,Hermes Agent 4.94T 全平台第一,Kilo Code 1.22T 與 Claude Code 606B 擠進 Top 5;CLI+Agent 類工具合計吃掉本週約 70%+ Token。結構預告:應用榜讀法 → 全平台快照 → CLI Top 10 → 功能矩陣 → 場景選型 → 五步落地 → 案例 → Mac 租賃決策。
1. 痛點拆解:應用榜 vs 模型榜,別再看錯表
1)模型榜回答「接誰」:OpenRouter rankings 裡的 Top Models、Programming Collections 告訴你 DeepSeek-V4-Flash、Hy3 preview 等模型誰被呼叫最多——適合寫進 openclaw.json 或 Cursor 的 fallback 鏈(詳見週 Token 榜解讀)。2)應用榜回答「用哪款工具」:openrouter.ai/apps 記錄的是已接入並公開追蹤的客戶端——Hermes、Kilo Code、Claude Code 各自消耗多少 Token,反映的是執行環境 + 工作流的真實滲透率。3)Stars ≠ 用量:OpenCode 有 97,500+ Stars 增速最快,但 OpenRouter 本週榜外;Aider 41,200+ Stars 極成熟,週 Token 卻遠低於互動式 Agent——自動化批次任務與「邊寫邊聊」模式 Token 曲線完全不同。4)Mac 特殊性:Claude Code 的 macOS Seatbelt 沙箱、Goose 的 Rust 在 Apple Silicon 上的效能、Kilo Code 與 VS Code 在 macOS 檔案權限上的配合——榜單前列工具與 Mac 存在天然綁定,選型必須疊加硬體維度。
許多團隊的錯誤在於:把「週模型榜第一名」直接設成所有 CLI 工具的預設模型,卻忽略執行環境本身才是 Token 消耗的大頭。Hermes 4.94T 並非因為它用了某個特定模型,而是因為大量自動化腳本、研究實驗與 Headless CI 在 Hermes 上 7×24 運轉——這種「流量軌」與 Claude Code 的「品質軌」必須分帳管理。若你只看模型榜,會誤以為 DeepSeek-V4-Flash 是唯一答案;若只看 Stars,會誤以為 OpenCode 已經贏了。應用榜才是 Agent 時代的體溫計。
2. 資料來源:2026/6/2–6/8 本週快照
統計口徑:OpenRouter 官方 Top Apps 頁面「This Week」維度(自然週週一至週日),截至 2026 年 6 月 8 日。僅包含選擇公開追蹤的應用,非全樣本,但覆蓋主流 CLI/IDE Agent。CLI 專項榜在全平台資料基礎上,結合近 30 日累計、終端可用性、MCP/沙箱能力、開源狀態與社群活躍度綜合排序;純娛樂類應用(Janitor AI 等)不計入 CLI 專項。
與Programming Collections 十億級週快照對照閱讀時,你會發現:模型層 DeepSeek 矩陣稱霸,應用層 Hermes/Kilo/Claude Code 三足鼎立——兩層資料互補,不可混用。建議每週一固定存檔兩張榜的 diff,作為 Mac 團隊的「路由週報」。
3. 全平台 Top 10:CLI 雙雄進前五
| 排名 | 應用 | 類型 | 本週 Token | 備註 |
|---|---|---|---|---|
| 1 | Hermes Agent | AI Agent(CLI) | 4.94T | 全平台第一,開源零門檻 |
| 2 | OpenClaw | 通用 Agent | 1.26T | IM 自動化,Mac 常駐熱門 |
| 3 | Kilo Code | CLI / IDE 外掛 | 1.22T | 500+ 模型,四種工作模式 |
| 4 | Claude Code | 終端原生 CLI | 606B | 閉源推理天花板 |
| 5 | Descript | 音視訊編輯 | 454B | 非開發類,說明平台覆蓋面擴大 |
| 6–10 | pi / Lemonade / Pioneer 等 | 混合 | 218B–384B | CLI 類本週僅 Hermes/Kilo/Claude 進 Top 5 |
關鍵趨勢:CLI 與 Agent 類工具合計約 70%+ 本週 Token;Hermes 單應用 4.94T 約為第二名 OpenClaw(1.26T)的近 4 倍——大量自動化腳本、研究實驗與批次任務在開源 Agent 上爆發,與 IDE 內「邊聊邊改」的互動模式形成兩極。OpenClaw 1.26T 說明 IM/Gateway 級 Agent 仍是 Mac 常駐主力;Kilo 1.22T 證明「多模型 IDE Agent」已從極客玩具變成日常生產力。
4. CLI 專項 Top 10 速覽
| CLI 排名 | 工具 | 全平台本週 | 本週/月 Token | 開源 | 核心亮點 |
|---|---|---|---|---|---|
| 1 | Kilo Code | #3 | 1.22T | ✅ | 500+ 模型,Architect/Code/Debug/Orchestrator |
| 2 | Claude Code | #4 | 606B | ❌ | Sub-agent、Seatbelt 沙箱、Plan Mode |
| 3 | Hermes Agent | #1 | 4.94T | ✅ | 完全開源,跨會話記憶,自動化滲透極深 |
| 4 | Aider | 榜外 | ~2.4B/月 | ✅ | Git 原生,Tree-sitter Repo Map |
| 5 | Cline | 榜外 | ~140B/月 | ✅ | 逐步審批,瀏覽器自動化 |
| 6 | Goose | 榜外 | ~46.4B/月 | ✅ | MCP 原生 1700+ 服務,Recipes 工作流 |
| 7 | OpenCode | 榜外 | 快速成長 | ✅ | 75+ 提供商,Docker 沙箱 |
| 8 | OpenAI Codex CLI | 榜外 | ~91B/月 | ✅ | 雲端沙箱,高速 Codex 模型 |
| 9 | Roo Code | 榜外 | ~111.8B/月 | ✅ | Cline 增強 Fork,Boomerang 任務 |
| 10 | Qwen Code | 榜外 | ~39.9M/月 | ✅ | 中英雙語,Qwen2.5-Coder 深度整合 |
CLI 專項排名與全平台排名刻意不同:Hermes 全平台第一,但 CLI 專項排第三,因為 OpenClaw 等 Gateway 類工具在「純終端 CLI」維度被排除。Kilo 在 CLI 專項第一,反映 IDE 外掛 + 終端雙模態的綜合得分。榜外工具(Aider、Cline、Goose)月 Token 仍可觀,代表「小眾但剛需」的垂直場景——Git 歷史整潔、逐步審批、企業 MCP 編排——不會因週榜缺席而失去價值。
5. 橫向功能矩陣:五維硬指標
| 能力 | Kilo | Claude Code | Hermes | Aider | Cline | Goose | OpenCode |
|---|---|---|---|---|---|---|---|
| MCP | ✅ | ✅ | ✅ | ❌ | ✅ | ✅✅ | ✅ |
| 沙箱隔離 | ❌ | ✅ Seatbelt | ❌ | ❌ | 快照 | Docker | Docker |
| Sub-agent | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
| 免費 BYOK | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 模型數量 | 500+ | Claude only | 多模型 | 100+ | 全平台 | 多模型 | 75+ |
讀表口訣:要模型自由選 Kilo;要推理與安全選 Claude Code;要零成本自動化選 Hermes;要Git 歷史整潔選 Aider;要逐步審計選 Cline;要企業工具鏈選 Goose。
MCP(Model Context Protocol)已成 CLI Agent 的「USB 介面」——Goose 原生支援 1700+ MCP 服務,適合接 Jira、GitHub、Slack 的 DevOps 編排;Claude Code 的 MCP 整合在 macOS Seatbelt 下可驗證權限邊界,對合規團隊有吸引力。沙箱維度上,Docker(Goose/OpenCode)吃記憶體與磁碟 I/O,在 16GB MacBook Air 上常導致 swap 與溫控降頻——這正是遠端 Mac 租賃的切入點。BYOK(Bring Your Own Key)讓開源工具零訂閱費,但 Token 帳單需設硬頂,否則 Hermes 7×24 自動化會在週末悄悄燒穿預算。
6. 七大場景選型指南
場景 A · Git 歷史整潔
首選 Aider:每次修改自動 commit,Architect 模式用強模型規劃、弱模型實作降本。適合需要可審計 PR 歷史的開源維護者與合規團隊。在 Mac 上 Aider 對本機算力要求低,16GB Air 即可,主要成本在 OpenRouter API。
場景 B · 大型重構 + 預算充足
首選 Claude Code:Sub-agent 並行,SWE-bench 持續領先,約占 GitHub AI 輔助提交 4%。Plan Mode 適合跨模組架構調整。macOS Seatbelt 沙箱讓「Agent 改檔案」在 Mac 上可驗證隔離邊界——Windows WSL 難以等價複製。
場景 C · 最大模型靈活性
首選 Kilo Code:OpenRouter 一鍵切換 500+ 模型,Architect/Code/Debug/Orchestrator 四模式覆蓋全開發週期。本週 1.22T 證明使用深度,非試用級流量。VS Code 外掛 + 終端 CLI 雙模態,適合已在 Mac 上深度使用 VS Code 的團隊。
場景 D · 安全審計
首選 Cline:每步確認 + Checkpoint 回滾。瀏覽器自動化適合 E2E 驗證場景。對記憶體敏感——多 Tab 瀏覽器自動化 + LLM 上下文,建議 M3 Pro 32GB 起。
場景 E · DevOps 編排
首選 Goose:Recipes + MCP 接 Jira/GitHub/Slack。Rust 在 Apple Silicon 上效能優異。Docker 沙箱建議跑在遠端 Mac mini M4 Pro 32GB+,本機只做審閱。
場景 F · 預算有限
首選 Hermes Agent 或 Gemini CLI(後者注意 6 月政策,見Gemini CLI 爭議文)。Hermes 完全開源 + BYOK,適合 Headless 自動化與研究實驗——但務必設 Token 硬頂。
場景 G · 中文開發
首選 Qwen Code + Qwen2.5-Coder。中英雙語提示詞優化,適合繁體/簡體混合程式碼庫。月 Token 雖小,但垂直場景剛需強——勿因榜外而忽略。
7. 五步落地:把應用榜寫進 Mac 工作流
Step 1 — 每週一打開 openrouter.ai/apps,存檔 CLI 分類 diff
重點關注 category/coding/cli-agent 名次變化;Hermes/Kilo 週環比 >20% 時檢查是否該調整本機 Agent 常駐策略。建議用 git 或 Notion 存 weekly snapshot,方便回溯。
Step 2 — 拆「執行環境」與「模型路由」兩層設定
執行環境選 Hermes/OpenClaw/Kilo;模型層仍按 Programming Collections 週更——兩層勿混寫在同一設定檔裡。常見反模式:在 Hermes 裡硬編碼 Claude Opus,導致 Dollar 軌與 Token 軌混帳。
Step 3 — 標註 Mac 三檔:本機 / OpenRouter API / 遠端 Mac
輕量 Aider/Hermes → 本機 16GB Air;Kilo+Cline 瀏覽器自動化 → M3 Pro 32GB;Goose+Docker 沙箱 → 遠端 Mac mini M4 Pro 32GB+。三檔分流讓記憶體、頻寬與 API 成本各歸其位。
Step 4 — 設 Agent Token 預算與 Headless CI 隔離
Claude Code Pro $20/月 起 + 按量;開源 BYOK 工具設月度 OpenRouter 硬頂(如 $500),超限自動切 DeepSeek-V4-Flash。Headless CI 用獨立 API Key,避免與本機互動 Agent 搶配額。
Step 5 — 20 任務驗收:同一需求跑三條棧對照
各用 Hermes、Kilo Code、Claude Code 完成相同 refactor/issue,記錄耗時、$/任務、回滾次數——比讀榜更可靠。建議建立內部 benchmark 表,每季更新。
8. Mac 租賃配置決策表
| 使用場景 | 推薦配置 | 典型工具棧 | 說明 |
|---|---|---|---|
| 輕量 CLI | MacBook Air M2/M3 16GB | Aider、Hermes | 主要依賴雲端 API,本機算力要求低 |
| 中等強度 | MacBook Pro M3 16–32GB | Kilo Code、Cline | 多檔案並發 + 瀏覽器自動化吃記憶體 |
| 重度沙箱 | Mac mini M4 Pro 32GB+ | Goose、OpenCode Docker | 並行 Agent + 容器 I/O 壓力大 |
| 本機模型兜底 | Mac Studio M4 Ultra 64GB+ | Ollama + OpenCode | 7B/14B 本機推理統一記憶體門檻 |
租賃決策的核心不是「買最貴的 Mac」,而是把 Token 大戶與記憶體大戶拆到不同節點。Hermes/OpenClaw 常駐適合遠端 Mac + launchd;Kilo/Cursor 互動審閱留本機;Goose Docker 沙箱專用遠端 32GB+ 節點,避免本機 16GB 被容器 swap 拖垮。MACGPU 遠端節點提供固定月費與穩定頻寬,比自建 VPS 跑 macOS 虛擬化更適合 Apple Silicon 原生工具鏈。
9. 深度案例:為什麼 CLI 工具吃掉 70%+ Token,Mac 成事實標準平台
「一家 8 人遠端團隊原在 Windows + WSL 上混跑 Goose 與 Cline,OpenRouter 帳單月超 $4,100,且 Docker 沙箱在 NTFS 掛載碟上 I/O 抖動嚴重。對照 6 月第一週應用榜後:① Gateway 級任務遷到 Hermes Agent(自動化占 Token 大頭,互動改 Kilo Code);② 模型層 58% 切 DeepSeek-V4-Flash;③ 全員換租 MACGPU M4 Pro 32GB 遠端節點跑 Goose Docker + launchd 常駐 Hermes。四週後 Agent 相關 Token 降 31%,P95 沙箱啟動從 42s 降到 11s,本機 Windows 只留 Cursor 審閱——案例說明:榜單選棧 + 硬體分層 比單純換模型更有效。」
產業洞察:OpenRouter 應用榜揭示的不僅是「哪款 CLI 更火」,而是 Agent 化開發已進入規模化消耗階段——Hermes 4.94T 背後是個體開發者、研究機構與自動化流水線的大規模部署;Kilo 1.22T 說明「多模型 IDE Agent」已從極客玩具變成日常生產力;Claude Code 606B 雖少於 Hermes,但 ARPU 更高,印證「品質軌」與「流量軌」並存。Apple Silicon 統一記憶體讓「本機 Ollama 兜底 + 雲端 Agent」並存成為可能;macOS Seatbelt 讓 Claude Code 的安全敘事在 Mac 上可驗證——這正是 Mac 成為 AI 編程事實標準平台的技術原因,而非品牌迷信。
對台港開發者而言,繁體中文程式碼庫 + 英文文件並存的場景很常見——Qwen Code 與 Kilo 的多模型切換在此有優勢。同時,遠端 Mac 租賃可解決本地頻寬不穩、筆電夜間常駐過熱等問題:把 Hermes/OpenClaw 丟到 MACGPU 伺服器節點,本機 MacBook 只跑 Kilo 審閱,是 6 月第一週榜單給出的最務實落地路徑。
10. 可引用數字與驗收清單
① Hermes Agent 本週:4.94T(全平台 #1)。② Kilo Code:1.22T(#3)。③ Claude Code:606B(#4)。④ CLI+Agent 類合計:約 70%+ 本週 Token。⑤ Aider 安裝量:4.1M+;Cline Stars:58,600+。⑥ Claude Code 占 GitHub AI 輔助提交約 4%。
驗收清單: 應用榜 CLI 分類已截圖 □ | 執行環境與模型層設定已拆分 □ | Mac 三檔分流已標註 □ | BYOK 月度預算上限 □ | 20 任務三棧對照 □ | Docker 沙箱節點記憶體 ≥32GB □ | 遠端 Mac launchd 常駐 □
純 Windows 或 Linux 同樣能跑上述 CLI,但在與 Xcode/Final Cut/ComfyUI 並行、Claude Code Seatbelt 沙箱、launchd 7×24 常駐 Hermes/OpenClaw、Metal 側車 MLX 驗證的一體化工作流上,macOS 仍更順滑。若你已在 Mac 上試跑 Goose/OpenCode 的 Docker 沙箱或多 Agent 並行,但本機 16GB 被容器占滿、溫控降頻或無法夜間常駐——MACGPU 遠端 Mac 節點(M3 Pro 32GB / Mac mini M4 Pro)可專跑 Agent 與 Headless CI,本機只保留 Kilo/Cursor 審閱與 Dollar 軌推理,用租賃算力換可預測的月費與穩定吞吐。