2026 Hermes Agent Skills 進階全攻略：從 SKILL.md 到 GEPA 自我進化

2026 年初 Nous Research 發布 Hermes Agent，兩個月內 GitHub Star 突破 16 萬，成為 AI Agent 領域成長最快的開源專案之一。它的核心賣點不是更大的模型，而是 "the agent that grows with you"——Agent 會隨著使用越來越懂你。底層實作就是 Skills（技能）系統：一套有標準、可進化、跨會話持久的程序性記憶。本文跳過入門，直接進入進階：Skills 與 Memory/Prompt 的差異、SKILL.md 格式與三級漸進載入、Skill Bundles、條件啟用、GEPA+DSPy 自我進化、Tap 發布與開源生態。結論：把「如何做」寫成可移植的 SKILL.md，用 Bundles 一鍵載入工作流，用 GEPA 讓技能越跑越好——無需動模型權重。 下文含概念對照表 — 格式解析 — Bundle/條件啟用 — 社群 Tap — GEPA 五階段 — 編寫技巧 — 部落格實戰 — FAQ — 資源連結。

1. 痛點拆解：為什麼 Skills 值得單獨深入研究？

1）Prompt 是一次性的：每次對話重複 800 字部署說明，Token 浪費且易漏步驟。2）Memory 是事實，不是流程：記住「你喜歡 TypeScript」不等於知道「如何按團隊規範開 PR」。3）Token 成本失控：把所有 Runbook 塞進系統提示，Level 0 就吃掉數萬 Token。4）無法跨平台複用：各 Agent 各寫一套設定，團隊無法共享。Hermes Skills 遵循 agentskills.io 開放標準，可在 Hermes、Claude Code、Cursor、OpenCode 之間移植——這才是 2026 年最值得押注的 Agent 基礎設施。

2. 核心概念：Skills ≠ Prompts，Skills ≠ Memory

維度	普通 Prompt	Memory（記憶）	Skills（技能）
持久性	當前對話	跨會話，永久	跨會話，永久
載入時機	每次都在上下文中	每次會話自動注入	按需載入（關鍵差異）
Token 成本	每次消耗	小而穩定	啟用前零消耗
內容類型	任意意圖描述	使用者偏好/事實	程序性步驟（如何做某件事）
誰來維護	使用者手動	Agent 自動	使用者 + Agent 均可
可共享性	不方便	私有	可發布為社群 Tap

記憶口訣：Prompt = 便利貼（當次有效）；Memory = 便條本（永久筆記，隨時在手邊）；Skill = SOP 手冊（步驟化流程，需要時翻閱）。

3. SKILL.md 格式深度解析（agentskills.io 開放標準）

所有 Hermes Skills 遵循 agentskills.io 規範，確保跨 Agent 可移植：

---
name: my-skill                    # 必填：小寫字母+連字符，≤64字元
description: |                    # 必填：≤1024字元，建議以"Use when..."開頭
  Use when the user needs to [...].
  Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read   # 預授權工具（實驗性）
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow, test-driven-development]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

# My Skill Title

## Overview
1-2 paragraphs: what it does and why it exists.

## When to Use
- Use for: [具體場景]
- Don't use for: [明確的排除場景]

## Procedure
1. 步驟一（包含精確命令）
2. 步驟二
3. 步驟三

## Common Pitfalls
1. 常見問題及修復方案

## Verification Checklist
- [ ] 驗證點 1
- [ ] 驗證點 2

3.1 技能目錄結構（模組化設計）

~/.hermes/skills/
└── my-category/
    └── my-skill/
        ├── SKILL.md              # 主檔案（核心步驟，建議 ≤500 行）
        ├── references/
        │   ├── api-docs.md       # API 參考（按需載入）
        │   └── examples.md
        ├── templates/
        │   └── config.yaml
        └── scripts/
            └── setup.sh          # Agent 可直接執行的腳本

3.2 Progressive Disclosure 三級載入機制

載入層級	內容	觸發時機	Token 成本
Level 0	`name` + `description`	每次會話開始，所有技能	~3K（全部技能合計）
Level 1	完整 SKILL.md 正文	使用者 `/skill-name` 或 LLM 判斷需要	取決於檔案長度
Level 2	references/ scripts/ 檔案	LLM 在執行時判斷需要	按需，單檔

寫作建議：description 欄位是 Level 0 的全部資訊，LLM 靠它決定是否載入完整技能。寫清「什麼時候用」比「是什麼」更重要。可用 skills-ref validate ./my-skill 驗證格式合規性。

4. Skill Bundles：一條命令觸發完整工作流

Skill Bundles 是 Hermes 2026 新增的強力特性。Bundle 是輕量 YAML 檔案，把多個相關技能打包成一個斜線命令。執行 /bundle-name 時，所有列出的技能同時載入，無需逐個觸發。檔案位置：~/.hermes/skill-bundles/<slug>.yaml

name: backend-dev
description: |
  Full backend feature workflow — code review, TDD, and PR management.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Open PRs with co-author tags for pair-programming sessions.
  Never push directly to main.

進階場景範例：AI 研究員工作流可打包 arxiv + deep-research + plan + excalidraw；MLOps 部署流水線可打包 vllm + llama-cpp + github-pr-workflow + systematic-debugging。

Bundle 優先順序規則：Bundle 與單個 Skill 同名時，Bundle 優先；Bundle 中未安裝的 Skill 跳過而不報錯並提示缺失；Bundle 不修改系統提示，不會導致 Prompt Cache 失效（Token 友好）。CLI 快速建立：

hermes bundles create backend-dev \
  --skills github-code-review,test-driven-development,github-pr-workflow \
  --instruction "Always write failing tests first"

5. 條件啟用（Conditional Activation）：智慧感知環境

技能可根據當前會話中工具的可用性，自動顯示或隱藏。在 SKILL.md 的 metadata.hermes 下設定：

欄位	行為邏輯
`requires_toolsets`	列出的工具集不存在時，隱藏此技能
`requires_tools`	列出的工具不存在時，隱藏此技能
`fallback_for_toolsets`	列出的工具集存在時，隱藏此技能（作為備選方案）
`fallback_for_tools`	列出的工具存在時，隱藏此技能

經典場景——免費/付費工具智慧切換：當使用者設定了 FIRECRAWL_KEY / BRAVE_SEARCH_KEY 時，付費的 web_search 工具啟用，DuckDuckGo 技能（fallback_for_tools: [web_search]）自動從提示詞中消失，節省 Token；API 不可用時，備選方案自動浮現。透過 hermes skills TUI，還可為 CLI、Telegram、Discord 等平台獨立開關某個技能。

6. Skills Hub 與開源社群生態

# 安裝官方可選技能
hermes skills install official/research/arxiv

# 從 HTTP URL 直接安裝
hermes skills install https://example.com/SKILL.md --name my-skill

# 從 GitHub 儲存庫安裝
hermes skills install github:openai/skills/k8s

# 新增自訂 Tap（訂閱整個技能儲存庫）
hermes skills tap add github:my-org/my-skills

儲存庫	描述	亮點
awesome-hermes-skills	精選生產級技能合集	Deep Research、MLOps、Apple 整合；23 個技能整合 GitHub Copilot
hermeshub	社群技能註冊中心	安全掃描認證、API 與市場功能、提示注入檢測
ai-agent-skills	191 個技能，28 個分類	支援 Hermes/Claude Code/Cursor 一鍵安裝
hermes-agent	官方主儲存庫	權威來源，含 Skill 編寫規範

7. 發布你自己的 Skill Tap：團隊與社群共享

my-skills-tap/
├── skills.sh.json              # 分類設定（可選）
├── mlops/
│   ├── vllm-deploy/SKILL.md
│   └── model-benchmark/SKILL.md
├── research/
│   ├── paper-summarizer/SKILL.md
│   └── citation-finder/SKILL.md
└── README.md

團隊部署流程：

# 團隊成員一鍵訂閱
hermes skills tap add github:your-org/your-skills-tap

# 私有儲存庫（需要 GitHub Token）
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN

# 更新所有 Tap 技能
hermes skills tap update

# 查看已訂閱的 Tap
hermes skills tap list

版本管理建議：將 ~/.hermes/skills/ 納入 Git 版本控制，跨裝置 git pull && hermes skills reset 同步後重建內建技能。

8. Self-Evolving Skills：GEPA + DSPy 讓技能自動進化

GEPA（Genetic-Pareto Prompt Evolution） 是 2026 年 ICLR Oral 論文成果，Nous Research 整合到 hermes-agent-self-evolution。核心思路：不微調模型權重，只透過分析執行軌跡、產生變體、多目標帕累托優化來改進技能文字本身。成本約 $2–10/次（純 API 呼叫，無需 GPU）。

GEPA 五階段進化流程：

Stage 1 執行軌跡收集（SQLite 資料庫，讀取全量推理軌跡）→ Stage 2 反思式失敗分析（LLM 產生「為什麼失敗」的可操作側資訊）→ Stage 3 靶向變異（針對失敗原因產生 10–20 個 SKILL.md 變體）→ Stage 4 多目標帕累托評估（同時優化成功率 × Token 效率 × 速度）→ Stage 5 人工審查 PR（最優變體產生 PR，人工核准後上線）。

git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes

# 合成資料進化（入門推薦）
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source synthetic

# 真實會話資料（效果更好）
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source sessiondb

# 聯合 Claude Code / Gemini 軌跡（實驗性）
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source mixed \
    --trace-dirs ~/.claude/traces,~/.hermes/sessions

四大安全護欄：① 全量測試套件 pytest tests/ -q 必須 100% 通過；② 大小限制 Skills ≤ 15KB、工具描述 ≤ 500 字元；③ Prompt 快取相容性；④ 語意保留檢查（不能偏離技能原始核心目的）。

階段	優化目標	引擎	狀態
Phase 1	Skill 檔案（SKILL.md）	DSPy + GEPA	✅ 已實作
Phase 2	工具描述	DSPy + GEPA	🔲 計畫中
Phase 3	系統提示片段	DSPy + GEPA	🔲 計畫中
Phase 4	工具實作程式碼	Darwinian Evolver	🔲 計畫中
Phase 5	持續改進循環（全自動）	自動化流水線	🔲 計畫中

9. Plugin 技能：擴展 Hermes 的邊界

外掛可將技能打包成命名空間形式（plugin:skill），實現：技能不出現在預設 skills_list（減少系統提示雜訊）；只在使用者明確呼叫時啟用（Opt-in）；外掛內技能可相互引用。載入時自動展示同外掛下的兄弟技能。

# 載入外掛技能（命名空間格式）
skill_view("superpowers:writing-plans")

# plugin.yaml 中宣告技能
name: my-hermes-plugin
skills:
  - name: writing-plans
    path: skills/writing-plans/SKILL.md
  - name: editing
    path: skills/editing/SKILL.md

10. 技能編寫進階技巧（工程師視角）

10.1 description 決定啟用精度：❌「Helps with code.」→ ✅「Use when reviewing a pull request, checking for code quality issues, security vulnerabilities... Do NOT use for writing new code.」

10.2 Pitfalls 是品質分水嶺：應包含具體失敗模式、根因分析、可操作修復步驟（如 CSS selector 脆弱性、GitHub API 限流、大 diff Token 溢出等）。

10.3 腳本化：在 Procedure 中寫明 Agent 將執行 scripts/extract_schema.py --input $FILE，失敗時載入 references/manual-extract.md。

10.4 技能大小控制：<500 行全放 SKILL.md；500–1000 行移 references/；>1000 行強烈建議拆分；>15KB 超過 GEPA 限制必須拆分。

10.5 skill_manage 讓 Agent 自我維護：

skill_manage(action='patch', name='github-code-review',
    old_string='Check for obvious bugs',
    new_string='Check for: null pointer, SQL injection, XSS, logic errors')

# 開啟人工審批門
# config.yaml: skills.agent_writes_require_approval: true

11. 實戰案例：技術部落格工作流 Skills

# ~/.hermes/skill-bundles/blog-workflow.yaml
name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.
  Generate both Chinese and English title options.

自訂 seo-keyword-research 技能：在部落格寫作會話開始時，分別搜尋中文長尾（「X 怎麼用」「X 教學」）與英文長尾（「X tutorial」「how to X」「X vs Y」），交叉參考掘金熱榜、Dev.to trending、HN，輸出 3–5 個主關鍵字 + 10–15 個長尾詞矩陣。注意中英文受眾搜尋同一概念的方式不同（如「Agent」vs「智慧體」vs「代理」）。

12. 五步落地清單

Step 1 — 安裝 Hermes Agent 並瀏覽官方 Skills：hermes skills install official/research/arxiv。
Step 2 — 在 ~/.hermes/skills/ 建立第一個 SKILL.md，寫好 description 觸發條件。
Step 3 — 為常用工作流建立 Bundle YAML，用 hermes bundles create 快速產生。
Step 4 — 設定條件啟用（免費/付費工具 fallback），減少 Token 雜訊。
Step 5 — 團隊共享：建立 Tap 儲存庫，hermes skills tap add github:your-org/your-skills-tap；進階使用者可克隆 self-evolution 儲存庫跑 GEPA 優化。

13. FAQ 與可引用數字

Q：Skills 和 MCP 有什麼區別？ Skills 是程序性知識文件（教 Agent 怎麼做），MCP 是工具介面（給 Agent 額外工具呼叫能力）。兩者互補。
Q：為什麼 Skill 改了但 Agent 還在用舊版？ 當前會話不生效，需 /reset 開新會話，或安裝時加 --now（會導致 Prompt Cache 失效）。
Q：GEPA 進化出的技能安全嗎？ 四大護欄 + 人工 PR 審查；語意漂移檢測確保不偏離原始目的。
Q：如何在 Claude Code 中複用 Hermes Skills？ 複製 SKILL.md 到 ~/.claude/skills/，或用 ai-agent-skills 一鍵安裝多端。
Q：Skill 中文內容影響 Token 效率嗎？ 中文字元約 1–1.5 token/字，與英文相近；但 description 建議保留英文，LLM 匹配更精確。

可引用數字：① Hermes Agent 160k+ GitHub Stars（2026 年初，兩個月內）。② Level 0 全部技能合計約 ~3K Token。③ GEPA 單次優化成本 $2–10（無需 GPU）。④ GEPA Skills 大小限制 ≤15KB。⑤ ai-agent-skills 儲存庫 191 個跨平台技能。

14. 延伸閱讀與資源

官方：Hermes Agent 文件 · 中文文件 · Skills 系統 · agentskills.io
開源：hermes-agent-self-evolution · gepa-ai/gepa · stanfordnlp/dspy
社群：SegmentFault 中文實戰指南 · Dev.to Self-Improving Agent 解剖 · YouTube GEPA & Skill Bundles 教學

15. 深度案例：Hermes Skills + 遠端 Mac 7×24 進化閉環

「一家技術媒體團隊把部落格寫作封裝成 blog-workflow Bundle：本機 Hermes 負責 SEO 調研與大綱產生（Level 0 僅 ~3K Token 開銷），GEPA 每週用真實會話軌跡優化 outline-generator 的 Pitfalls 章節——成功率從 72% 提升到 91%，平均 Token 消耗下降 18%。重腳本（程式碼驗證、多語言發布）放在遠端 Mac 節點透過 SSH 執行，本機統一記憶體不被通宵佇列占滿。Tap 儲存庫供 8 人團隊 hermes skills tap add 一鍵同步，私有技能經 GitHub Token 訂閱。」

這與本站 OpenRouter Hermes 用量解讀、Cursor Agent Skills 指南形成互補：Cursor Skills 解決 IDE 內按需載入，Hermes Skills + GEPA 解決「越用越強」的閉環。Windows/Linux 也能跑 Hermes CLI，但在 與 Xcode/FCP/ComfyUI 並行、launchd 常駐 Gateway、Metal 側車推理 場景，macOS 仍更順暢。若 GEPA 進化或 Bundle 中的重腳本需要長時間跑測試、批量渲染，筆電統一記憶體容易被占滿——Skill 解決「怎麼做」，遠端 Mac 解決「在哪跑」。

若你已在用 Hermes Skills 整理工作流，又需要穩定、可租用的 Apple Silicon 算力跑 GEPA 評估、腳本與 7×24 Agent，可考慮 MACGPU 遠端 Mac 節點：專跑進化評估與批量任務，本機只保留 Hermes 編排與 Skill 編寫——統一記憶體留給思考，算力留給通宵佇列。