2026 Hermes Agent Skills 进阶全攻略：从 SKILL.md 到 GEPA 自我进化

2026 年初 Nous Research 发布 Hermes Agent，两个月内 GitHub Star 突破 16 万，成为 AI Agent 领域增速最快的开源项目之一。它的核心卖点不是更大的模型，而是 "the agent that grows with you"——Agent 会随着使用越来越懂你。底层实现就是 Skills（技能）系统：一套有标准、可进化、跨会话持久的程序性记忆。本文跳过入门，直接进入进阶：Skills 与 Memory/Prompt 的区别、SKILL.md 格式与三级渐进加载、Skill Bundles、条件激活、GEPA+DSPy 自我进化、Tap 发布与开源生态。结论：把「如何做」写成可移植的 SKILL.md，用 Bundles 一键加载工作流，用 GEPA 让技能越跑越好——无需动模型权重。 下文含概念对照表 — 格式解析 — Bundle/条件激活 — 社区 Tap — GEPA 五阶段 — 编写技巧 — 博客实战 — FAQ — 资源链接。

1. 痛点拆解：为什么 Skills 值得单独深入研究？

1）Prompt 是一次性的：每次对话重复 800 字部署说明，Token 浪费且易漏步骤。2）Memory 是事实，不是流程：记住「你喜欢 TypeScript」不等于知道「如何按团队规范开 PR」。3）Token 成本失控：把所有 Runbook 塞进系统提示，Level 0 就吃掉数万 Token。4）无法跨平台复用：各 Agent 各写一套配置，团队无法共享。Hermes Skills 遵循 agentskills.io 开放标准，可在 Hermes、Claude Code、Cursor、OpenCode 之间移植——这才是 2026 年最值得押注的 Agent 基础设施。

2. 核心概念：Skills ≠ Prompts，Skills ≠ Memory

维度	普通 Prompt	Memory（记忆）	Skills（技能）
持久性	当前对话	跨会话，永久	跨会话，永久
加载时机	每次都在上下文中	每次会话自动注入	按需加载（关键差异）
Token 成本	每次消耗	小而稳定	激活前零消耗
内容类型	任意意图描述	用户偏好/事实	程序性步骤（如何做某件事）
谁来维护	用户手动	Agent 自动	用户 + Agent 均可
可共享性	不方便	私有	可发布为社区 Tap

记忆口诀：Prompt = 便利贴（当次有效）；Memory = 便签本（永久笔记，随时在手边）；Skill = SOP 手册（步骤化流程，需要时翻阅）。

3. SKILL.md 格式深度解析（agentskills.io 开放标准）

所有 Hermes Skills 遵循 agentskills.io 规范，确保跨 Agent 可移植：

---
name: my-skill                    # 必填：小写字母+连字符，≤64字符
description: |                    # 必填：≤1024字符，建议以"Use when..."开头
  Use when the user needs to [...].
  Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read   # 预授权工具（实验性）
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow, test-driven-development]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

# My Skill Title

## Overview
1-2 paragraphs: what it does and why it exists.

## When to Use
- Use for: [具体场景]
- Don't use for: [明确的排除场景]

## Procedure
1. 步骤一（包含精确命令）
2. 步骤二
3. 步骤三

## Common Pitfalls
1. 常见问题及修复方案

## Verification Checklist
- [ ] 验证点 1
- [ ] 验证点 2

3.1 技能目录结构（模块化设计）

~/.hermes/skills/
└── my-category/
    └── my-skill/
        ├── SKILL.md              # 主文件（核心步骤，建议 ≤500 行）
        ├── references/
        │   ├── api-docs.md       # API 参考（按需加载）
        │   └── examples.md
        ├── templates/
        │   └── config.yaml
        └── scripts/
            └── setup.sh          # Agent 可直接执行的脚本

3.2 Progressive Disclosure 三级加载机制

加载层级	内容	触发时机	Token 成本
Level 0	`name` + `description`	每次会话开始，所有技能	~3K（全部技能合计）
Level 1	完整 SKILL.md 正文	用户 `/skill-name` 或 LLM 判断需要	取决于文件长度
Level 2	references/ scripts/ 文件	LLM 在执行时判断需要	按需，单文件

写作建议：description 字段是 Level 0 的全部信息，LLM 靠它决定是否加载完整技能。写清「什么时候用」比「是什么」更重要。可用 skills-ref validate ./my-skill 验证格式合规性。

4. Skill Bundles：一条命令触发完整工作流

Skill Bundles 是 Hermes 2026 新增的强力特性。Bundle 是轻量 YAML 文件，把多个相关技能打包成一个斜杠命令。执行 /bundle-name 时，所有列出的技能同时加载，无需逐个触发。文件位置：~/.hermes/skill-bundles/<slug>.yaml

name: backend-dev
description: |
  Full backend feature workflow — code review, TDD, and PR management.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Open PRs with co-author tags for pair-programming sessions.
  Never push directly to main.

进阶场景示例：AI 研究员工作流可打包 arxiv + deep-research + plan + excalidraw；MLOps 部署流水线可打包 vllm + llama-cpp + github-pr-workflow + systematic-debugging。

Bundle 优先级规则：Bundle 与单个 Skill 同名时，Bundle 优先；Bundle 中未安装的 Skill 跳过而不报错并提示缺失；Bundle 不修改系统提示，不会导致 Prompt Cache 失效（Token 友好）。CLI 快速创建：

hermes bundles create backend-dev \
  --skills github-code-review,test-driven-development,github-pr-workflow \
  --instruction "Always write failing tests first"

5. 条件激活（Conditional Activation）：智能感知环境

技能可根据当前会话中工具的可用性，自动显示或隐藏。在 SKILL.md 的 metadata.hermes 下配置：

字段	行为逻辑
`requires_toolsets`	列出的工具集不存在时，隐藏此技能
`requires_tools`	列出的工具不存在时，隐藏此技能
`fallback_for_toolsets`	列出的工具集存在时，隐藏此技能（作为备选方案）
`fallback_for_tools`	列出的工具存在时，隐藏此技能

经典场景——免费/付费工具智能切换：当用户配置了 FIRECRAWL_KEY / BRAVE_SEARCH_KEY 时，付费的 web_search 工具激活，DuckDuckGo 技能（fallback_for_tools: [web_search]）自动从提示词中消失，节省 Token；API 不可用时，备选方案自动浮现。通过 hermes skills TUI，还可为 CLI、Telegram、Discord 等平台独立开关某个技能。

6. Skills Hub 与开源社区生态

# 安装官方可选技能
hermes skills install official/research/arxiv

# 从 HTTP URL 直接安装
hermes skills install https://example.com/SKILL.md --name my-skill

# 从 GitHub 仓库安装
hermes skills install github:openai/skills/k8s

# 添加自定义 Tap（订阅整个技能仓库）
hermes skills tap add github:my-org/my-skills

仓库	描述	亮点
awesome-hermes-skills	精选生产级技能合集	Deep Research、MLOps、Apple 集成；23 个技能集成 GitHub Copilot
hermeshub	社区技能注册中心	安全扫描认证、API 与市场功能、提示注入检测
ai-agent-skills	191 个技能，28 个分类	支持 Hermes/Claude Code/Cursor 一键安装
hermes-agent	官方主仓库	权威来源，含 Skill 编写规范

7. 发布你自己的 Skill Tap：团队与社区共享

my-skills-tap/
├── skills.sh.json              # 分类配置（可选）
├── mlops/
│   ├── vllm-deploy/SKILL.md
│   └── model-benchmark/SKILL.md
├── research/
│   ├── paper-summarizer/SKILL.md
│   └── citation-finder/SKILL.md
└── README.md

团队部署流程：

# 团队成员一键订阅
hermes skills tap add github:your-org/your-skills-tap

# 私有仓库（需要 GitHub Token）
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN

# 更新所有 Tap 技能
hermes skills tap update

# 查看已订阅的 Tap
hermes skills tap list

版本管理建议：将 ~/.hermes/skills/ 纳入 Git 版本控制，跨设备 git pull && hermes skills reset 同步后重建内置技能。

8. Self-Evolving Skills：GEPA + DSPy 让技能自动进化

GEPA（Genetic-Pareto Prompt Evolution） 是 2026 年 ICLR Oral 论文成果，Nous Research 集成到 hermes-agent-self-evolution。核心思路：不微调模型权重，只通过分析执行轨迹、生成变体、多目标帕累托优化来改进技能文本本身。成本约 $2–10/次（纯 API 调用，无需 GPU）。

GEPA 五阶段进化流程：

Stage 1 执行轨迹收集（SQLite 数据库，读取全量推理轨迹）→ Stage 2 反思式失败分析（LLM 生成「为什么失败」的可操作侧信息）→ Stage 3 靶向变异（针对失败原因生成 10–20 个 SKILL.md 变体）→ Stage 4 多目标帕累托评估（同时优化成功率 × Token 效率 × 速度）→ Stage 5 人工审查 PR（最优变体生成 PR，人工批准后上线）。

git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes

# 合成数据进化（入门推荐）
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source synthetic

# 真实会话数据（效果更好）
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source sessiondb

# 联合 Claude Code / Gemini 轨迹（实验性）
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source mixed \
    --trace-dirs ~/.claude/traces,~/.hermes/sessions

四大安全护栏：① 全量测试套件 pytest tests/ -q 必须 100% 通过；② 大小限制 Skills ≤ 15KB、工具描述 ≤ 500 字符；③ Prompt 缓存兼容性；④ 语义保留检查（不能偏离技能原始核心目的）。

阶段	优化目标	引擎	状态
Phase 1	Skill 文件（SKILL.md）	DSPy + GEPA	✅ 已实现
Phase 2	工具描述	DSPy + GEPA	🔲 计划中
Phase 3	系统提示片段	DSPy + GEPA	🔲 计划中
Phase 4	工具实现代码	Darwinian Evolver	🔲 计划中
Phase 5	持续改进循环（全自动）	自动化流水线	🔲 计划中

9. Plugin 技能：扩展 Hermes 的边界

插件可将技能打包成命名空间形式（plugin:skill），实现：技能不出现在默认 skills_list（减少系统提示噪声）；只在用户明确调用时激活（Opt-in）；插件内技能可相互引用。加载时自动展示同插件下的兄弟技能。

# 加载插件技能（命名空间格式）
skill_view("superpowers:writing-plans")

# plugin.yaml 中声明技能
name: my-hermes-plugin
skills:
  - name: writing-plans
    path: skills/writing-plans/SKILL.md
  - name: editing
    path: skills/editing/SKILL.md

10. 技能编写进阶技巧（工程师视角）

10.1 description 决定激活精度：❌「Helps with code.」→ ✅「Use when reviewing a pull request, checking for code quality issues, security vulnerabilities... Do NOT use for writing new code.」

10.2 Pitfalls 是质量分水岭：应包含具体失败模式、根因分析、可操作修复步骤（如 CSS selector 脆弱性、GitHub API 限流、大 diff Token 溢出等）。

10.3 脚本化：在 Procedure 中写明 Agent 将执行 scripts/extract_schema.py --input $FILE，失败时加载 references/manual-extract.md。

10.4 技能大小控制：<500 行全放 SKILL.md；500–1000 行移 references/；>1000 行强烈建议拆分；>15KB 超过 GEPA 限制必须拆分。

10.5 skill_manage 让 Agent 自我维护：

skill_manage(action='patch', name='github-code-review',
    old_string='Check for obvious bugs',
    new_string='Check for: null pointer, SQL injection, XSS, logic errors')

# 开启人工审批门
# config.yaml: skills.agent_writes_require_approval: true

11. 实战案例：技术博客工作流 Skills

# ~/.hermes/skill-bundles/blog-workflow.yaml
name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.
  Generate both Chinese and English title options.

自定义 seo-keyword-research 技能：在博客写作会话开始时，分别搜索中文长尾（「X 怎么用」「X 教程」）与英文长尾（「X tutorial」「how to X」「X vs Y」），交叉参考掘金热榜、Dev.to trending、HN，输出 3–5 个主关键词 + 10–15 个长尾词矩阵。注意中英文受众搜索同一概念的方式不同（如「Agent」vs「智能体」vs「代理」）。

12. 五步落地清单

Step 1 — 安装 Hermes Agent 并浏览官方 Skills：hermes skills install official/research/arxiv。
Step 2 — 在 ~/.hermes/skills/ 创建第一个 SKILL.md，写好 description 触发条件。
Step 3 — 为常用工作流创建 Bundle YAML，用 hermes bundles create 快速生成。
Step 4 — 配置条件激活（免费/付费工具 fallback），减少 Token 噪声。
Step 5 — 团队共享：创建 Tap 仓库，hermes skills tap add github:your-org/your-skills-tap；进阶用户可克隆 self-evolution 仓库跑 GEPA 优化。

13. FAQ 与可引用数字

Q：Skills 和 MCP 有什么区别？ Skills 是程序性知识文档（教 Agent 怎么做），MCP 是工具接口（给 Agent 额外工具调用能力）。两者互补。
Q：为什么 Skill 改了但 Agent 还在用旧版？ 当前会话不生效，需 /reset 开新会话，或安装时加 --now（会导致 Prompt Cache 失效）。
Q：GEPA 进化出的技能安全吗？ 四大护栏 + 人工 PR 审查；语义漂移检测确保不偏离原始目的。
Q：如何在 Claude Code 中复用 Hermes Skills？ 复制 SKILL.md 到 ~/.claude/skills/，或用 ai-agent-skills 一键安装多端。
Q：Skill 中文内容影响 Token 效率吗？ 中文字符约 1–1.5 token/字，与英文相近；但 description 建议保留英文，LLM 匹配更精确。

可引用数字：① Hermes Agent 160k+ GitHub Stars（2026 年初，两个月内）。② Level 0 全部技能合计约 ~3K Token。③ GEPA 单次优化成本 $2–10（无需 GPU）。④ GEPA Skills 大小限制 ≤15KB。⑤ ai-agent-skills 仓库 191 个跨平台技能。

14. 延伸阅读与资源

官方：Hermes Agent 文档 · 中文文档 · Skills 系统 · agentskills.io
开源：hermes-agent-self-evolution · gepa-ai/gepa · stanfordnlp/dspy
社区：SegmentFault 中文实战指南 · Dev.to Self-Improving Agent 解剖 · YouTube GEPA & Skill Bundles 教程

15. 深度案例：Hermes Skills + 远程 Mac 7×24 进化闭环

「一家技术媒体团队把博客写作封装成 blog-workflow Bundle：本机 Hermes 负责 SEO 调研与大纲生成（Level 0 仅 ~3K Token 开销），GEPA 每周用真实会话轨迹优化 outline-generator 的 Pitfalls 章节——成功率从 72% 提升到 91%，平均 Token 消耗下降 18%。重脚本（代码验证、多语言发布）放在远程 Mac 节点通过 SSH 执行，本机统一内存不被通宵队列占满。Tap 仓库供 8 人团队 hermes skills tap add 一键同步，私有技能经 GitHub Token 订阅。」

这与本站 OpenRouter Hermes 用量解读、Cursor Agent Skills 指南形成互补：Cursor Skills 解决 IDE 内按需加载，Hermes Skills + GEPA 解决「越用越强」的闭环。Windows/Linux 也能跑 Hermes CLI，但在 与 Xcode/FCP/ComfyUI 并行、launchd 常驻 Gateway、Metal 侧车推理 场景，macOS 仍更顺滑。若 GEPA 进化或 Bundle 中的重脚本需要长时间跑测试、批量渲染，笔记本统一内存容易被占满——Skill 解决「怎么做」，远程 Mac 解决「在哪跑」。

若你已在用 Hermes Skills 整理工作流，又需要稳定、可租用的 Apple Silicon 算力跑 GEPA 评估、脚本与 7×24 Agent，可考虑 MACGPU 远程 Mac 节点：专跑进化评估与批量任务，本机只保留 Hermes 编排与 Skill 编写——统一内存留给思考，算力留给通宵队列。