2026 年 6 月 OpenRouter Top Apps CLI 工具榜深度解讀

GitHub Stars 會騙人，但 OpenRouter Top Apps 上每週結算的 Token 不會。痛點：Mac 開發者在 Hermes Agent、Kilo Code、Claude Code、Aider、Cline 之間搖擺，卻分不清「模型榜」與「應用榜」——前者告訴你該接哪個 LLM，後者才反映哪條 Agent 棧真在被重度使用。結論：2026 年 6 月第一週，Hermes Agent 4.94T 全平台第一，Kilo Code 1.22T 與 Claude Code 606B 擠進 Top 5；CLI+Agent 類工具合計吃掉本週約 70%+ Token。結構預告：應用榜讀法 → 全平台快照 → CLI Top 10 → 功能矩陣 → 場景選型 → 五步落地 → 案例 → Mac 租賃決策。

1. 痛點拆解：應用榜 vs 模型榜，別再看錯表

1）模型榜回答「接誰」：OpenRouter rankings 裡的 Top Models、Programming Collections 告訴你 DeepSeek-V4-Flash、Hy3 preview 等模型誰被呼叫最多——適合寫進 openclaw.json 或 Cursor 的 fallback 鏈（詳見週 Token 榜解讀）。2）應用榜回答「用哪款工具」：openrouter.ai/apps 記錄的是已接入並公開追蹤的客戶端——Hermes、Kilo Code、Claude Code 各自消耗多少 Token，反映的是執行環境 + 工作流的真實滲透率。3）Stars ≠ 用量：OpenCode 有 97,500+ Stars 增速最快，但 OpenRouter 本週榜外；Aider 41,200+ Stars 極成熟，週 Token 卻遠低於互動式 Agent——自動化批次任務與「邊寫邊聊」模式 Token 曲線完全不同。4）Mac 特殊性：Claude Code 的 macOS Seatbelt 沙箱、Goose 的 Rust 在 Apple Silicon 上的效能、Kilo Code 與 VS Code 在 macOS 檔案權限上的配合——榜單前列工具與 Mac 存在天然綁定，選型必須疊加硬體維度。

許多團隊的錯誤在於：把「週模型榜第一名」直接設成所有 CLI 工具的預設模型，卻忽略執行環境本身才是 Token 消耗的大頭。Hermes 4.94T 並非因為它用了某個特定模型，而是因為大量自動化腳本、研究實驗與 Headless CI 在 Hermes 上 7×24 運轉——這種「流量軌」與 Claude Code 的「品質軌」必須分帳管理。若你只看模型榜，會誤以為 DeepSeek-V4-Flash 是唯一答案；若只看 Stars，會誤以為 OpenCode 已經贏了。應用榜才是 Agent 時代的體溫計。

2. 資料來源：2026/6/2–6/8 本週快照

統計口徑：OpenRouter 官方 Top Apps 頁面「This Week」維度（自然週週一至週日），截至 2026 年 6 月 8 日。僅包含選擇公開追蹤的應用，非全樣本，但覆蓋主流 CLI/IDE Agent。CLI 專項榜在全平台資料基礎上，結合近 30 日累計、終端可用性、MCP/沙箱能力、開源狀態與社群活躍度綜合排序；純娛樂類應用（Janitor AI 等）不計入 CLI 專項。

與Programming Collections 十億級週快照對照閱讀時，你會發現：模型層 DeepSeek 矩陣稱霸，應用層 Hermes/Kilo/Claude Code 三足鼎立——兩層資料互補，不可混用。建議每週一固定存檔兩張榜的 diff，作為 Mac 團隊的「路由週報」。

3. 全平台 Top 10：CLI 雙雄進前五

排名	應用	類型	本週 Token	備註
1	Hermes Agent	AI Agent（CLI）	4.94T	全平台第一，開源零門檻
2	OpenClaw	通用 Agent	1.26T	IM 自動化，Mac 常駐熱門
3	Kilo Code	CLI / IDE 外掛	1.22T	500+ 模型，四種工作模式
4	Claude Code	終端原生 CLI	606B	閉源推理天花板
5	Descript	音視訊編輯	454B	非開發類，說明平台覆蓋面擴大
6–10	pi / Lemonade / Pioneer 等	混合	218B–384B	CLI 類本週僅 Hermes/Kilo/Claude 進 Top 5

關鍵趨勢：CLI 與 Agent 類工具合計約 70%+ 本週 Token；Hermes 單應用 4.94T 約為第二名 OpenClaw（1.26T）的近 4 倍——大量自動化腳本、研究實驗與批次任務在開源 Agent 上爆發，與 IDE 內「邊聊邊改」的互動模式形成兩極。OpenClaw 1.26T 說明 IM/Gateway 級 Agent 仍是 Mac 常駐主力；Kilo 1.22T 證明「多模型 IDE Agent」已從極客玩具變成日常生產力。

4. CLI 專項 Top 10 速覽

CLI 排名	工具	全平台本週	本週/月 Token	開源	核心亮點
1	Kilo Code	#3	1.22T	✅	500+ 模型，Architect/Code/Debug/Orchestrator
2	Claude Code	#4	606B	❌	Sub-agent、Seatbelt 沙箱、Plan Mode
3	Hermes Agent	#1	4.94T	✅	完全開源，跨會話記憶，自動化滲透極深
4	Aider	榜外	~2.4B/月	✅	Git 原生，Tree-sitter Repo Map
5	Cline	榜外	~140B/月	✅	逐步審批，瀏覽器自動化
6	Goose	榜外	~46.4B/月	✅	MCP 原生 1700+ 服務，Recipes 工作流
7	OpenCode	榜外	快速成長	✅	75+ 提供商，Docker 沙箱
8	OpenAI Codex CLI	榜外	~91B/月	✅	雲端沙箱，高速 Codex 模型
9	Roo Code	榜外	~111.8B/月	✅	Cline 增強 Fork，Boomerang 任務
10	Qwen Code	榜外	~39.9M/月	✅	中英雙語，Qwen2.5-Coder 深度整合

CLI 專項排名與全平台排名刻意不同：Hermes 全平台第一，但 CLI 專項排第三，因為 OpenClaw 等 Gateway 類工具在「純終端 CLI」維度被排除。Kilo 在 CLI 專項第一，反映 IDE 外掛 + 終端雙模態的綜合得分。榜外工具（Aider、Cline、Goose）月 Token 仍可觀，代表「小眾但剛需」的垂直場景——Git 歷史整潔、逐步審批、企業 MCP 編排——不會因週榜缺席而失去價值。

5. 橫向功能矩陣：五維硬指標

能力	Kilo	Claude Code	Hermes	Aider	Cline	Goose	OpenCode
MCP	✅	✅	✅	❌	✅	✅✅	✅
沙箱隔離	❌	✅ Seatbelt	❌	❌	快照	Docker	Docker
Sub-agent	✅	✅	✅	❌	✅	✅	✅
免費 BYOK	✅	❌	✅	✅	✅	✅	✅
模型數量	500+	Claude only	多模型	100+	全平台	多模型	75+

讀表口訣：要模型自由選 Kilo；要推理與安全選 Claude Code；要零成本自動化選 Hermes；要Git 歷史整潔選 Aider；要逐步審計選 Cline；要企業工具鏈選 Goose。

MCP（Model Context Protocol）已成 CLI Agent 的「USB 介面」——Goose 原生支援 1700+ MCP 服務，適合接 Jira、GitHub、Slack 的 DevOps 編排；Claude Code 的 MCP 整合在 macOS Seatbelt 下可驗證權限邊界，對合規團隊有吸引力。沙箱維度上，Docker（Goose/OpenCode）吃記憶體與磁碟 I/O，在 16GB MacBook Air 上常導致 swap 與溫控降頻——這正是遠端 Mac 租賃的切入點。BYOK（Bring Your Own Key）讓開源工具零訂閱費，但 Token 帳單需設硬頂，否則 Hermes 7×24 自動化會在週末悄悄燒穿預算。

6. 七大場景選型指南

場景 A · Git 歷史整潔

首選 Aider：每次修改自動 commit，Architect 模式用強模型規劃、弱模型實作降本。適合需要可審計 PR 歷史的開源維護者與合規團隊。在 Mac 上 Aider 對本機算力要求低，16GB Air 即可，主要成本在 OpenRouter API。

場景 B · 大型重構 + 預算充足

首選 Claude Code：Sub-agent 並行，SWE-bench 持續領先，約占 GitHub AI 輔助提交 4%。Plan Mode 適合跨模組架構調整。macOS Seatbelt 沙箱讓「Agent 改檔案」在 Mac 上可驗證隔離邊界——Windows WSL 難以等價複製。

場景 C · 最大模型靈活性

首選 Kilo Code：OpenRouter 一鍵切換 500+ 模型，Architect/Code/Debug/Orchestrator 四模式覆蓋全開發週期。本週 1.22T 證明使用深度，非試用級流量。VS Code 外掛 + 終端 CLI 雙模態，適合已在 Mac 上深度使用 VS Code 的團隊。

場景 D · 安全審計

首選 Cline：每步確認 + Checkpoint 回滾。瀏覽器自動化適合 E2E 驗證場景。對記憶體敏感——多 Tab 瀏覽器自動化 + LLM 上下文，建議 M3 Pro 32GB 起。

場景 E · DevOps 編排

首選 Goose：Recipes + MCP 接 Jira/GitHub/Slack。Rust 在 Apple Silicon 上效能優異。Docker 沙箱建議跑在遠端 Mac mini M4 Pro 32GB+，本機只做審閱。

場景 F · 預算有限

首選 Hermes Agent 或 Gemini CLI（後者注意 6 月政策，見Gemini CLI 爭議文）。Hermes 完全開源 + BYOK，適合 Headless 自動化與研究實驗——但務必設 Token 硬頂。

場景 G · 中文開發

首選 Qwen Code + Qwen2.5-Coder。中英雙語提示詞優化，適合繁體/簡體混合程式碼庫。月 Token 雖小，但垂直場景剛需強——勿因榜外而忽略。

7. 五步落地：把應用榜寫進 Mac 工作流

Step 1 — 每週一打開 openrouter.ai/apps，存檔 CLI 分類 diff

重點關注 category/coding/cli-agent 名次變化；Hermes/Kilo 週環比 >20% 時檢查是否該調整本機 Agent 常駐策略。建議用 git 或 Notion 存 weekly snapshot，方便回溯。

Step 2 — 拆「執行環境」與「模型路由」兩層設定

執行環境選 Hermes/OpenClaw/Kilo；模型層仍按 Programming Collections 週更——兩層勿混寫在同一設定檔裡。常見反模式：在 Hermes 裡硬編碼 Claude Opus，導致 Dollar 軌與 Token 軌混帳。

Step 3 — 標註 Mac 三檔：本機 / OpenRouter API / 遠端 Mac

輕量 Aider/Hermes → 本機 16GB Air；Kilo+Cline 瀏覽器自動化 → M3 Pro 32GB；Goose+Docker 沙箱 → 遠端 Mac mini M4 Pro 32GB+。三檔分流讓記憶體、頻寬與 API 成本各歸其位。

Step 4 — 設 Agent Token 預算與 Headless CI 隔離

Claude Code Pro $20/月 起 + 按量；開源 BYOK 工具設月度 OpenRouter 硬頂（如 $500），超限自動切 DeepSeek-V4-Flash。Headless CI 用獨立 API Key，避免與本機互動 Agent 搶配額。

Step 5 — 20 任務驗收：同一需求跑三條棧對照

各用 Hermes、Kilo Code、Claude Code 完成相同 refactor/issue，記錄耗時、$/任務、回滾次數——比讀榜更可靠。建議建立內部 benchmark 表，每季更新。

# 環境變數骨架（Mac + OpenRouter BYOK）
export OPENROUTER_API_KEY="sk-or-..."
# Kilo Code / Aider / Cline 通用
export AIDER_MODEL="openrouter/deepseek/deepseek-v4-flash"
# Hermes Agent 指向同一 Key，避免多帳單
# Claude Code 走 Anthropic 直連，與 OpenRouter 分層記帳
                

8. Mac 租賃配置決策表

使用場景	推薦配置	典型工具棧	說明
輕量 CLI	MacBook Air M2/M3 16GB	Aider、Hermes	主要依賴雲端 API，本機算力要求低
中等強度	MacBook Pro M3 16–32GB	Kilo Code、Cline	多檔案並發 + 瀏覽器自動化吃記憶體
重度沙箱	Mac mini M4 Pro 32GB+	Goose、OpenCode Docker	並行 Agent + 容器 I/O 壓力大
本機模型兜底	Mac Studio M4 Ultra 64GB+	Ollama + OpenCode	7B/14B 本機推理統一記憶體門檻

租賃決策的核心不是「買最貴的 Mac」，而是把 Token 大戶與記憶體大戶拆到不同節點。Hermes/OpenClaw 常駐適合遠端 Mac + launchd；Kilo/Cursor 互動審閱留本機；Goose Docker 沙箱專用遠端 32GB+ 節點，避免本機 16GB 被容器 swap 拖垮。MACGPU 遠端節點提供固定月費與穩定頻寬，比自建 VPS 跑 macOS 虛擬化更適合 Apple Silicon 原生工具鏈。

9. 深度案例：為什麼 CLI 工具吃掉 70%+ Token，Mac 成事實標準平台

「一家 8 人遠端團隊原在 Windows + WSL 上混跑 Goose 與 Cline，OpenRouter 帳單月超 $4,100，且 Docker 沙箱在 NTFS 掛載碟上 I/O 抖動嚴重。對照 6 月第一週應用榜後：① Gateway 級任務遷到 Hermes Agent（自動化占 Token 大頭，互動改 Kilo Code）；② 模型層 58% 切 DeepSeek-V4-Flash；③ 全員換租 MACGPU M4 Pro 32GB 遠端節點跑 Goose Docker + launchd 常駐 Hermes。四週後 Agent 相關 Token 降 31%，P95 沙箱啟動從 42s 降到 11s，本機 Windows 只留 Cursor 審閱——案例說明：榜單選棧 + 硬體分層 比單純換模型更有效。」

產業洞察：OpenRouter 應用榜揭示的不僅是「哪款 CLI 更火」，而是 Agent 化開發已進入規模化消耗階段——Hermes 4.94T 背後是個體開發者、研究機構與自動化流水線的大規模部署；Kilo 1.22T 說明「多模型 IDE Agent」已從極客玩具變成日常生產力；Claude Code 606B 雖少於 Hermes，但 ARPU 更高，印證「品質軌」與「流量軌」並存。Apple Silicon 統一記憶體讓「本機 Ollama 兜底 + 雲端 Agent」並存成為可能；macOS Seatbelt 讓 Claude Code 的安全敘事在 Mac 上可驗證——這正是 Mac 成為 AI 編程事實標準平台的技術原因，而非品牌迷信。

對台港開發者而言，繁體中文程式碼庫 + 英文文件並存的場景很常見——Qwen Code 與 Kilo 的多模型切換在此有優勢。同時，遠端 Mac 租賃可解決本地頻寬不穩、筆電夜間常駐過熱等問題：把 Hermes/OpenClaw 丟到 MACGPU 伺服器節點，本機 MacBook 只跑 Kilo 審閱，是 6 月第一週榜單給出的最務實落地路徑。

10. 可引用數字與驗收清單

① Hermes Agent 本週：4.94T（全平台 #1）。② Kilo Code：1.22T（#3）。③ Claude Code：606B（#4）。④ CLI+Agent 類合計：約 70%+ 本週 Token。⑤ Aider 安裝量：4.1M+；Cline Stars：58,600+。⑥ Claude Code 占 GitHub AI 輔助提交約 4%。

純 Windows 或 Linux 同樣能跑上述 CLI，但在與 Xcode/Final Cut/ComfyUI 並行、Claude Code Seatbelt 沙箱、launchd 7×24 常駐 Hermes/OpenClaw、Metal 側車 MLX 驗證的一體化工作流上，macOS 仍更順滑。若你已在 Mac 上試跑 Goose/OpenCode 的 Docker 沙箱或多 Agent 並行，但本機 16GB 被容器占滿、溫控降頻或無法夜間常駐——MACGPU 遠端 Mac 節點（M3 Pro 32GB / Mac mini M4 Pro）可專跑 Agent 與 Headless CI，本機只保留 Kilo/Cursor 審閱與 Dollar 軌推理，用租賃算力換可預測的月費與穩定吞吐。