2026 OPENROUTER
CLI_TOP_
APPS_
MAC_PICK.

OpenRouter CLI 工具排行與 Mac 開發者選型

GitHub Stars 會騙人,但 OpenRouter Top Apps 上每週結算的 Token 不會。痛點:Mac 開發者在 Hermes Agent、Kilo Code、Claude Code、Aider、Cline 之間搖擺,卻分不清「模型榜」與「應用榜」——前者告訴你該接哪個 LLM,後者才反映哪條 Agent 棧真在被重度使用結論:2026 年 6 月第一週,Hermes Agent 4.94T 全平台第一,Kilo Code 1.22TClaude Code 606B 擠進 Top 5;CLI+Agent 類工具合計吃掉本週約 70%+ Token。結構預告:應用榜讀法 → 全平台快照 → CLI Top 10 → 功能矩陣 → 場景選型 → 五步落地 → 案例 → Mac 租賃決策。

1. 痛點拆解:應用榜 vs 模型榜,別再看錯表

1)模型榜回答「接誰」:OpenRouter rankings 裡的 Top Models、Programming Collections 告訴你 DeepSeek-V4-Flash、Hy3 preview 等模型誰被呼叫最多——適合寫進 openclaw.json 或 Cursor 的 fallback 鏈(詳見週 Token 榜解讀)。2)應用榜回答「用哪款工具」openrouter.ai/apps 記錄的是已接入並公開追蹤的客戶端——Hermes、Kilo Code、Claude Code 各自消耗多少 Token,反映的是執行環境 + 工作流的真實滲透率。3)Stars ≠ 用量:OpenCode 有 97,500+ Stars 增速最快,但 OpenRouter 本週榜外;Aider 41,200+ Stars 極成熟,週 Token 卻遠低於互動式 Agent——自動化批次任務與「邊寫邊聊」模式 Token 曲線完全不同。4)Mac 特殊性:Claude Code 的 macOS Seatbelt 沙箱、Goose 的 Rust 在 Apple Silicon 上的效能、Kilo Code 與 VS Code 在 macOS 檔案權限上的配合——榜單前列工具與 Mac 存在天然綁定,選型必須疊加硬體維度。

許多團隊的錯誤在於:把「週模型榜第一名」直接設成所有 CLI 工具的預設模型,卻忽略執行環境本身才是 Token 消耗的大頭。Hermes 4.94T 並非因為它用了某個特定模型,而是因為大量自動化腳本、研究實驗與 Headless CI 在 Hermes 上 7×24 運轉——這種「流量軌」與 Claude Code 的「品質軌」必須分帳管理。若你只看模型榜,會誤以為 DeepSeek-V4-Flash 是唯一答案;若只看 Stars,會誤以為 OpenCode 已經贏了。應用榜才是 Agent 時代的體溫計

2. 資料來源:2026/6/2–6/8 本週快照

統計口徑:OpenRouter 官方 Top Apps 頁面「This Week」維度(自然週週一至週日),截至 2026 年 6 月 8 日。僅包含選擇公開追蹤的應用,非全樣本,但覆蓋主流 CLI/IDE Agent。CLI 專項榜在全平台資料基礎上,結合近 30 日累計、終端可用性、MCP/沙箱能力、開源狀態與社群活躍度綜合排序;純娛樂類應用(Janitor AI 等)不計入 CLI 專項。

Programming Collections 十億級週快照對照閱讀時,你會發現:模型層 DeepSeek 矩陣稱霸,應用層 Hermes/Kilo/Claude Code 三足鼎立——兩層資料互補,不可混用。建議每週一固定存檔兩張榜的 diff,作為 Mac 團隊的「路由週報」。

3. 全平台 Top 10:CLI 雙雄進前五

排名應用類型本週 Token備註
1Hermes AgentAI Agent(CLI)4.94T全平台第一,開源零門檻
2OpenClaw通用 Agent1.26TIM 自動化,Mac 常駐熱門
3Kilo CodeCLI / IDE 外掛1.22T500+ 模型,四種工作模式
4Claude Code終端原生 CLI606B閉源推理天花板
5Descript音視訊編輯454B非開發類,說明平台覆蓋面擴大
6–10pi / Lemonade / Pioneer 等混合218B–384BCLI 類本週僅 Hermes/Kilo/Claude 進 Top 5

關鍵趨勢:CLI 與 Agent 類工具合計約 70%+ 本週 Token;Hermes 單應用 4.94T 約為第二名 OpenClaw(1.26T)的近 4 倍——大量自動化腳本、研究實驗與批次任務在開源 Agent 上爆發,與 IDE 內「邊聊邊改」的互動模式形成兩極。OpenClaw 1.26T 說明 IM/Gateway 級 Agent 仍是 Mac 常駐主力;Kilo 1.22T 證明「多模型 IDE Agent」已從極客玩具變成日常生產力。

4. CLI 專項 Top 10 速覽

CLI 排名工具全平台本週本週/月 Token開源核心亮點
1Kilo Code#31.22T500+ 模型,Architect/Code/Debug/Orchestrator
2Claude Code#4606BSub-agent、Seatbelt 沙箱、Plan Mode
3Hermes Agent#14.94T完全開源,跨會話記憶,自動化滲透極深
4Aider榜外~2.4B/月Git 原生,Tree-sitter Repo Map
5Cline榜外~140B/月逐步審批,瀏覽器自動化
6Goose榜外~46.4B/月MCP 原生 1700+ 服務,Recipes 工作流
7OpenCode榜外快速成長75+ 提供商,Docker 沙箱
8OpenAI Codex CLI榜外~91B/月雲端沙箱,高速 Codex 模型
9Roo Code榜外~111.8B/月Cline 增強 Fork,Boomerang 任務
10Qwen Code榜外~39.9M/月中英雙語,Qwen2.5-Coder 深度整合

CLI 專項排名與全平台排名刻意不同:Hermes 全平台第一,但 CLI 專項排第三,因為 OpenClaw 等 Gateway 類工具在「純終端 CLI」維度被排除。Kilo 在 CLI 專項第一,反映 IDE 外掛 + 終端雙模態的綜合得分。榜外工具(Aider、Cline、Goose)月 Token 仍可觀,代表「小眾但剛需」的垂直場景——Git 歷史整潔、逐步審批、企業 MCP 編排——不會因週榜缺席而失去價值。

5. 橫向功能矩陣:五維硬指標

能力KiloClaude CodeHermesAiderClineGooseOpenCode
MCP✅✅
沙箱隔離✅ Seatbelt快照DockerDocker
Sub-agent
免費 BYOK
模型數量500+Claude only多模型100+全平台多模型75+

讀表口訣:要模型自由選 Kilo;要推理與安全選 Claude Code;要零成本自動化選 Hermes;要Git 歷史整潔選 Aider;要逐步審計選 Cline;要企業工具鏈選 Goose。

MCP(Model Context Protocol)已成 CLI Agent 的「USB 介面」——Goose 原生支援 1700+ MCP 服務,適合接 Jira、GitHub、Slack 的 DevOps 編排;Claude Code 的 MCP 整合在 macOS Seatbelt 下可驗證權限邊界,對合規團隊有吸引力。沙箱維度上,Docker(Goose/OpenCode)吃記憶體與磁碟 I/O,在 16GB MacBook Air 上常導致 swap 與溫控降頻——這正是遠端 Mac 租賃的切入點。BYOK(Bring Your Own Key)讓開源工具零訂閱費,但 Token 帳單需設硬頂,否則 Hermes 7×24 自動化會在週末悄悄燒穿預算。

6. 七大場景選型指南

場景 A · Git 歷史整潔

首選 Aider:每次修改自動 commit,Architect 模式用強模型規劃、弱模型實作降本。適合需要可審計 PR 歷史的開源維護者與合規團隊。在 Mac 上 Aider 對本機算力要求低,16GB Air 即可,主要成本在 OpenRouter API。

場景 B · 大型重構 + 預算充足

首選 Claude Code:Sub-agent 並行,SWE-bench 持續領先,約占 GitHub AI 輔助提交 4%。Plan Mode 適合跨模組架構調整。macOS Seatbelt 沙箱讓「Agent 改檔案」在 Mac 上可驗證隔離邊界——Windows WSL 難以等價複製。

場景 C · 最大模型靈活性

首選 Kilo Code:OpenRouter 一鍵切換 500+ 模型,Architect/Code/Debug/Orchestrator 四模式覆蓋全開發週期。本週 1.22T 證明使用深度,非試用級流量。VS Code 外掛 + 終端 CLI 雙模態,適合已在 Mac 上深度使用 VS Code 的團隊。

場景 D · 安全審計

首選 Cline:每步確認 + Checkpoint 回滾。瀏覽器自動化適合 E2E 驗證場景。對記憶體敏感——多 Tab 瀏覽器自動化 + LLM 上下文,建議 M3 Pro 32GB 起。

場景 E · DevOps 編排

首選 Goose:Recipes + MCP 接 Jira/GitHub/Slack。Rust 在 Apple Silicon 上效能優異。Docker 沙箱建議跑在遠端 Mac mini M4 Pro 32GB+,本機只做審閱。

場景 F · 預算有限

首選 Hermes Agent 或 Gemini CLI(後者注意 6 月政策,見Gemini CLI 爭議文)。Hermes 完全開源 + BYOK,適合 Headless 自動化與研究實驗——但務必設 Token 硬頂。

場景 G · 中文開發

首選 Qwen Code + Qwen2.5-Coder。中英雙語提示詞優化,適合繁體/簡體混合程式碼庫。月 Token 雖小,但垂直場景剛需強——勿因榜外而忽略。

7. 五步落地:把應用榜寫進 Mac 工作流

Step 1 — 每週一打開 openrouter.ai/apps,存檔 CLI 分類 diff

重點關注 category/coding/cli-agent 名次變化;Hermes/Kilo 週環比 >20% 時檢查是否該調整本機 Agent 常駐策略。建議用 git 或 Notion 存 weekly snapshot,方便回溯。

Step 2 — 拆「執行環境」與「模型路由」兩層設定

執行環境選 Hermes/OpenClaw/Kilo;模型層仍按 Programming Collections 週更——兩層勿混寫在同一設定檔裡。常見反模式:在 Hermes 裡硬編碼 Claude Opus,導致 Dollar 軌與 Token 軌混帳。

Step 3 — 標註 Mac 三檔:本機 / OpenRouter API / 遠端 Mac

輕量 Aider/Hermes → 本機 16GB Air;Kilo+Cline 瀏覽器自動化 → M3 Pro 32GB;Goose+Docker 沙箱 → 遠端 Mac mini M4 Pro 32GB+。三檔分流讓記憶體、頻寬與 API 成本各歸其位。

Step 4 — 設 Agent Token 預算與 Headless CI 隔離

Claude Code Pro $20/月 起 + 按量;開源 BYOK 工具設月度 OpenRouter 硬頂(如 $500),超限自動切 DeepSeek-V4-Flash。Headless CI 用獨立 API Key,避免與本機互動 Agent 搶配額。

Step 5 — 20 任務驗收:同一需求跑三條棧對照

各用 Hermes、Kilo Code、Claude Code 完成相同 refactor/issue,記錄耗時、$/任務、回滾次數——比讀榜更可靠。建議建立內部 benchmark 表,每季更新。

# 環境變數骨架(Mac + OpenRouter BYOK) export OPENROUTER_API_KEY="sk-or-..." # Kilo Code / Aider / Cline 通用 export AIDER_MODEL="openrouter/deepseek/deepseek-v4-flash" # Hermes Agent 指向同一 Key,避免多帳單 # Claude Code 走 Anthropic 直連,與 OpenRouter 分層記帳

8. Mac 租賃配置決策表

使用場景推薦配置典型工具棧說明
輕量 CLIMacBook Air M2/M3 16GBAider、Hermes主要依賴雲端 API,本機算力要求低
中等強度MacBook Pro M3 16–32GBKilo Code、Cline多檔案並發 + 瀏覽器自動化吃記憶體
重度沙箱Mac mini M4 Pro 32GB+Goose、OpenCode Docker並行 Agent + 容器 I/O 壓力大
本機模型兜底Mac Studio M4 Ultra 64GB+Ollama + OpenCode7B/14B 本機推理統一記憶體門檻

租賃決策的核心不是「買最貴的 Mac」,而是把 Token 大戶與記憶體大戶拆到不同節點。Hermes/OpenClaw 常駐適合遠端 Mac + launchd;Kilo/Cursor 互動審閱留本機;Goose Docker 沙箱專用遠端 32GB+ 節點,避免本機 16GB 被容器 swap 拖垮。MACGPU 遠端節點提供固定月費與穩定頻寬,比自建 VPS 跑 macOS 虛擬化更適合 Apple Silicon 原生工具鏈。

9. 深度案例:為什麼 CLI 工具吃掉 70%+ Token,Mac 成事實標準平台

「一家 8 人遠端團隊原在 Windows + WSL 上混跑 Goose 與 Cline,OpenRouter 帳單月超 $4,100,且 Docker 沙箱在 NTFS 掛載碟上 I/O 抖動嚴重。對照 6 月第一週應用榜後:① Gateway 級任務遷到 Hermes Agent(自動化占 Token 大頭,互動改 Kilo Code);② 模型層 58% 切 DeepSeek-V4-Flash;③ 全員換租 MACGPU M4 Pro 32GB 遠端節點跑 Goose Docker + launchd 常駐 Hermes。四週後 Agent 相關 Token 降 31%,P95 沙箱啟動從 42s 降到 11s,本機 Windows 只留 Cursor 審閱——案例說明:榜單選棧 + 硬體分層 比單純換模型更有效。」

產業洞察:OpenRouter 應用榜揭示的不僅是「哪款 CLI 更火」,而是 Agent 化開發已進入規模化消耗階段——Hermes 4.94T 背後是個體開發者、研究機構與自動化流水線的大規模部署;Kilo 1.22T 說明「多模型 IDE Agent」已從極客玩具變成日常生產力;Claude Code 606B 雖少於 Hermes,但 ARPU 更高,印證「品質軌」與「流量軌」並存。Apple Silicon 統一記憶體讓「本機 Ollama 兜底 + 雲端 Agent」並存成為可能;macOS Seatbelt 讓 Claude Code 的安全敘事在 Mac 上可驗證——這正是 Mac 成為 AI 編程事實標準平台的技術原因,而非品牌迷信。

對台港開發者而言,繁體中文程式碼庫 + 英文文件並存的場景很常見——Qwen Code 與 Kilo 的多模型切換在此有優勢。同時,遠端 Mac 租賃可解決本地頻寬不穩、筆電夜間常駐過熱等問題:把 Hermes/OpenClaw 丟到 MACGPU 伺服器節點,本機 MacBook 只跑 Kilo 審閱,是 6 月第一週榜單給出的最務實落地路徑。

10. 可引用數字與驗收清單

① Hermes Agent 本週:4.94T(全平台 #1)。② Kilo Code:1.22T(#3)。③ Claude Code:606B(#4)。④ CLI+Agent 類合計:約 70%+ 本週 Token。⑤ Aider 安裝量:4.1M+;Cline Stars:58,600+。⑥ Claude Code 占 GitHub AI 輔助提交約 4%

驗收清單: 應用榜 CLI 分類已截圖 □ | 執行環境與模型層設定已拆分 □ | Mac 三檔分流已標註 □ | BYOK 月度預算上限 □ | 20 任務三棧對照 □ | Docker 沙箱節點記憶體 ≥32GB □ | 遠端 Mac launchd 常駐 □

純 Windows 或 Linux 同樣能跑上述 CLI,但在與 Xcode/Final Cut/ComfyUI 並行、Claude Code Seatbelt 沙箱、launchd 7×24 常駐 Hermes/OpenClaw、Metal 側車 MLX 驗證的一體化工作流上,macOS 仍更順滑。若你已在 Mac 上試跑 Goose/OpenCode 的 Docker 沙箱或多 Agent 並行,但本機 16GB 被容器占滿、溫控降頻或無法夜間常駐——MACGPU 遠端 Mac 節點(M3 Pro 32GB / Mac mini M4 Pro)可專跑 Agent 與 Headless CI,本機只保留 Kilo/Cursor 審閱與 Dollar 軌推理,用租賃算力換可預測的月費與穩定吞吐。