2026 HERMES
SKILLS_
GEPA_
EVOLVE.
2026 年初 Nous Research 發布 Hermes Agent,兩個月內 GitHub Star 突破 16 萬,成為 AI Agent 領域成長最快的開源專案之一。它的核心賣點不是更大的模型,而是 "the agent that grows with you"——Agent 會隨著使用越來越懂你。底層實作就是 Skills(技能)系統:一套有標準、可進化、跨會話持久的程序性記憶。本文跳過入門,直接進入進階:Skills 與 Memory/Prompt 的差異、SKILL.md 格式與三級漸進載入、Skill Bundles、條件啟用、GEPA+DSPy 自我進化、Tap 發布與開源生態。結論:把「如何做」寫成可移植的 SKILL.md,用 Bundles 一鍵載入工作流,用 GEPA 讓技能越跑越好——無需動模型權重。 下文含概念對照表 — 格式解析 — Bundle/條件啟用 — 社群 Tap — GEPA 五階段 — 編寫技巧 — 部落格實戰 — FAQ — 資源連結。
1. 痛點拆解:為什麼 Skills 值得單獨深入研究?
1)Prompt 是一次性的:每次對話重複 800 字部署說明,Token 浪費且易漏步驟。2)Memory 是事實,不是流程:記住「你喜歡 TypeScript」不等於知道「如何按團隊規範開 PR」。3)Token 成本失控:把所有 Runbook 塞進系統提示,Level 0 就吃掉數萬 Token。4)無法跨平台複用:各 Agent 各寫一套設定,團隊無法共享。Hermes Skills 遵循 agentskills.io 開放標準,可在 Hermes、Claude Code、Cursor、OpenCode 之間移植——這才是 2026 年最值得押注的 Agent 基礎設施。
2. 核心概念:Skills ≠ Prompts,Skills ≠ Memory
| 維度 | 普通 Prompt | Memory(記憶) | Skills(技能) |
|---|---|---|---|
| 持久性 | 當前對話 | 跨會話,永久 | 跨會話,永久 |
| 載入時機 | 每次都在上下文中 | 每次會話自動注入 | 按需載入(關鍵差異) |
| Token 成本 | 每次消耗 | 小而穩定 | 啟用前零消耗 |
| 內容類型 | 任意意圖描述 | 使用者偏好/事實 | 程序性步驟(如何做某件事) |
| 誰來維護 | 使用者手動 | Agent 自動 | 使用者 + Agent 均可 |
| 可共享性 | 不方便 | 私有 | 可發布為社群 Tap |
記憶口訣:Prompt = 便利貼(當次有效);Memory = 便條本(永久筆記,隨時在手邊);Skill = SOP 手冊(步驟化流程,需要時翻閱)。
3. SKILL.md 格式深度解析(agentskills.io 開放標準)
所有 Hermes Skills 遵循 agentskills.io 規範,確保跨 Agent 可移植:
3.1 技能目錄結構(模組化設計)
3.2 Progressive Disclosure 三級載入機制
| 載入層級 | 內容 | 觸發時機 | Token 成本 |
|---|---|---|---|
| Level 0 | name + description | 每次會話開始,所有技能 | ~3K(全部技能合計) |
| Level 1 | 完整 SKILL.md 正文 | 使用者 /skill-name 或 LLM 判斷需要 | 取決於檔案長度 |
| Level 2 | references/ scripts/ 檔案 | LLM 在執行時判斷需要 | 按需,單檔 |
寫作建議:description 欄位是 Level 0 的全部資訊,LLM 靠它決定是否載入完整技能。寫清「什麼時候用」比「是什麼」更重要。可用 skills-ref validate ./my-skill 驗證格式合規性。
4. Skill Bundles:一條命令觸發完整工作流
Skill Bundles 是 Hermes 2026 新增的強力特性。Bundle 是輕量 YAML 檔案,把多個相關技能打包成一個斜線命令。執行 /bundle-name 時,所有列出的技能同時載入,無需逐個觸發。檔案位置:~/.hermes/skill-bundles/<slug>.yaml
進階場景範例:AI 研究員工作流可打包 arxiv + deep-research + plan + excalidraw;MLOps 部署流水線可打包 vllm + llama-cpp + github-pr-workflow + systematic-debugging。
Bundle 優先順序規則:Bundle 與單個 Skill 同名時,Bundle 優先;Bundle 中未安裝的 Skill 跳過而不報錯並提示缺失;Bundle 不修改系統提示,不會導致 Prompt Cache 失效(Token 友好)。CLI 快速建立:
5. 條件啟用(Conditional Activation):智慧感知環境
技能可根據當前會話中工具的可用性,自動顯示或隱藏。在 SKILL.md 的 metadata.hermes 下設定:
| 欄位 | 行為邏輯 |
|---|---|
requires_toolsets | 列出的工具集不存在時,隱藏此技能 |
requires_tools | 列出的工具不存在時,隱藏此技能 |
fallback_for_toolsets | 列出的工具集存在時,隱藏此技能(作為備選方案) |
fallback_for_tools | 列出的工具存在時,隱藏此技能 |
經典場景——免費/付費工具智慧切換:當使用者設定了 FIRECRAWL_KEY / BRAVE_SEARCH_KEY 時,付費的 web_search 工具啟用,DuckDuckGo 技能(fallback_for_tools: [web_search])自動從提示詞中消失,節省 Token;API 不可用時,備選方案自動浮現。透過 hermes skills TUI,還可為 CLI、Telegram、Discord 等平台獨立開關某個技能。
6. Skills Hub 與開源社群生態
| 儲存庫 | 描述 | 亮點 |
|---|---|---|
| awesome-hermes-skills | 精選生產級技能合集 | Deep Research、MLOps、Apple 整合;23 個技能整合 GitHub Copilot |
| hermeshub | 社群技能註冊中心 | 安全掃描認證、API 與市場功能、提示注入檢測 |
| ai-agent-skills | 191 個技能,28 個分類 | 支援 Hermes/Claude Code/Cursor 一鍵安裝 |
| hermes-agent | 官方主儲存庫 | 權威來源,含 Skill 編寫規範 |
7. 發布你自己的 Skill Tap:團隊與社群共享
團隊部署流程:
版本管理建議:將 ~/.hermes/skills/ 納入 Git 版本控制,跨裝置 git pull && hermes skills reset 同步後重建內建技能。
8. Self-Evolving Skills:GEPA + DSPy 讓技能自動進化
GEPA(Genetic-Pareto Prompt Evolution) 是 2026 年 ICLR Oral 論文成果,Nous Research 整合到 hermes-agent-self-evolution。核心思路:不微調模型權重,只透過分析執行軌跡、產生變體、多目標帕累托優化來改進技能文字本身。成本約 $2–10/次(純 API 呼叫,無需 GPU)。
GEPA 五階段進化流程:
Stage 1 執行軌跡收集(SQLite 資料庫,讀取全量推理軌跡)→ Stage 2 反思式失敗分析(LLM 產生「為什麼失敗」的可操作側資訊)→ Stage 3 靶向變異(針對失敗原因產生 10–20 個 SKILL.md 變體)→ Stage 4 多目標帕累托評估(同時優化成功率 × Token 效率 × 速度)→ Stage 5 人工審查 PR(最優變體產生 PR,人工核准後上線)。
四大安全護欄:① 全量測試套件 pytest tests/ -q 必須 100% 通過;② 大小限制 Skills ≤ 15KB、工具描述 ≤ 500 字元;③ Prompt 快取相容性;④ 語意保留檢查(不能偏離技能原始核心目的)。
| 階段 | 優化目標 | 引擎 | 狀態 |
|---|---|---|---|
| Phase 1 | Skill 檔案(SKILL.md) | DSPy + GEPA | ✅ 已實作 |
| Phase 2 | 工具描述 | DSPy + GEPA | 🔲 計畫中 |
| Phase 3 | 系統提示片段 | DSPy + GEPA | 🔲 計畫中 |
| Phase 4 | 工具實作程式碼 | Darwinian Evolver | 🔲 計畫中 |
| Phase 5 | 持續改進循環(全自動) | 自動化流水線 | 🔲 計畫中 |
9. Plugin 技能:擴展 Hermes 的邊界
外掛可將技能打包成命名空間形式(plugin:skill),實現:技能不出現在預設 skills_list(減少系統提示雜訊);只在使用者明確呼叫時啟用(Opt-in);外掛內技能可相互引用。載入時自動展示同外掛下的兄弟技能。
10. 技能編寫進階技巧(工程師視角)
10.1 description 決定啟用精度:❌「Helps with code.」→ ✅「Use when reviewing a pull request, checking for code quality issues, security vulnerabilities... Do NOT use for writing new code.」
10.2 Pitfalls 是品質分水嶺:應包含具體失敗模式、根因分析、可操作修復步驟(如 CSS selector 脆弱性、GitHub API 限流、大 diff Token 溢出等)。
10.3 腳本化:在 Procedure 中寫明 Agent 將執行 scripts/extract_schema.py --input $FILE,失敗時載入 references/manual-extract.md。
10.4 技能大小控制:<500 行全放 SKILL.md;500–1000 行移 references/;>1000 行強烈建議拆分;>15KB 超過 GEPA 限制必須拆分。
10.5 skill_manage 讓 Agent 自我維護:
11. 實戰案例:技術部落格工作流 Skills
自訂 seo-keyword-research 技能:在部落格寫作會話開始時,分別搜尋中文長尾(「X 怎麼用」「X 教學」)與英文長尾(「X tutorial」「how to X」「X vs Y」),交叉參考掘金熱榜、Dev.to trending、HN,輸出 3–5 個主關鍵字 + 10–15 個長尾詞矩陣。注意中英文受眾搜尋同一概念的方式不同(如「Agent」vs「智慧體」vs「代理」)。
12. 五步落地清單
Step 1 — 安裝 Hermes Agent 並瀏覽官方 Skills:hermes skills install official/research/arxiv。
Step 2 — 在 ~/.hermes/skills/ 建立第一個 SKILL.md,寫好 description 觸發條件。
Step 3 — 為常用工作流建立 Bundle YAML,用 hermes bundles create 快速產生。
Step 4 — 設定條件啟用(免費/付費工具 fallback),減少 Token 雜訊。
Step 5 — 團隊共享:建立 Tap 儲存庫,hermes skills tap add github:your-org/your-skills-tap;進階使用者可克隆 self-evolution 儲存庫跑 GEPA 優化。
13. FAQ 與可引用數字
Q:Skills 和 MCP 有什麼區別? Skills 是程序性知識文件(教 Agent 怎麼做),MCP 是工具介面(給 Agent 額外工具呼叫能力)。兩者互補。
Q:為什麼 Skill 改了但 Agent 還在用舊版? 當前會話不生效,需 /reset 開新會話,或安裝時加 --now(會導致 Prompt Cache 失效)。
Q:GEPA 進化出的技能安全嗎? 四大護欄 + 人工 PR 審查;語意漂移檢測確保不偏離原始目的。
Q:如何在 Claude Code 中複用 Hermes Skills? 複製 SKILL.md 到 ~/.claude/skills/,或用 ai-agent-skills 一鍵安裝多端。
Q:Skill 中文內容影響 Token 效率嗎? 中文字元約 1–1.5 token/字,與英文相近;但 description 建議保留英文,LLM 匹配更精確。
可引用數字:① Hermes Agent 160k+ GitHub Stars(2026 年初,兩個月內)。② Level 0 全部技能合計約 ~3K Token。③ GEPA 單次優化成本 $2–10(無需 GPU)。④ GEPA Skills 大小限制 ≤15KB。⑤ ai-agent-skills 儲存庫 191 個跨平台技能。
14. 延伸閱讀與資源
官方:Hermes Agent 文件 · 中文文件 · Skills 系統 · agentskills.io
開源:hermes-agent-self-evolution · gepa-ai/gepa · stanfordnlp/dspy
社群:SegmentFault 中文實戰指南 · Dev.to Self-Improving Agent 解剖 · YouTube GEPA & Skill Bundles 教學
15. 深度案例:Hermes Skills + 遠端 Mac 7×24 進化閉環
「一家技術媒體團隊把部落格寫作封裝成 blog-workflow Bundle:本機 Hermes 負責 SEO 調研與大綱產生(Level 0 僅 ~3K Token 開銷),GEPA 每週用真實會話軌跡優化 outline-generator 的 Pitfalls 章節——成功率從 72% 提升到 91%,平均 Token 消耗下降 18%。重腳本(程式碼驗證、多語言發布)放在遠端 Mac 節點透過 SSH 執行,本機統一記憶體不被通宵佇列占滿。Tap 儲存庫供 8 人團隊 hermes skills tap add 一鍵同步,私有技能經 GitHub Token 訂閱。」
這與本站 OpenRouter Hermes 用量解讀、Cursor Agent Skills 指南 形成互補:Cursor Skills 解決 IDE 內按需載入,Hermes Skills + GEPA 解決「越用越強」的閉環。Windows/Linux 也能跑 Hermes CLI,但在 與 Xcode/FCP/ComfyUI 並行、launchd 常駐 Gateway、Metal 側車推理 場景,macOS 仍更順暢。若 GEPA 進化或 Bundle 中的重腳本需要長時間跑測試、批量渲染,筆電統一記憶體容易被占滿——Skill 解決「怎麼做」,遠端 Mac 解決「在哪跑」。
若你已在用 Hermes Skills 整理工作流,又需要穩定、可租用的 Apple Silicon 算力跑 GEPA 評估、腳本與 7×24 Agent,可考慮 MACGPU 遠端 Mac 節點:專跑進化評估與批量任務,本機只保留 Hermes 編排與 Skill 編寫——統一記憶體留給思考,算力留給通宵佇列。