2026 HERMES
SKILLS_
GEPA_
EVOLVE.
2026 年初 Nous Research 发布 Hermes Agent,两个月内 GitHub Star 突破 16 万,成为 AI Agent 领域增速最快的开源项目之一。它的核心卖点不是更大的模型,而是 "the agent that grows with you"——Agent 会随着使用越来越懂你。底层实现就是 Skills(技能)系统:一套有标准、可进化、跨会话持久的程序性记忆。本文跳过入门,直接进入进阶:Skills 与 Memory/Prompt 的区别、SKILL.md 格式与三级渐进加载、Skill Bundles、条件激活、GEPA+DSPy 自我进化、Tap 发布与开源生态。结论:把「如何做」写成可移植的 SKILL.md,用 Bundles 一键加载工作流,用 GEPA 让技能越跑越好——无需动模型权重。 下文含概念对照表 — 格式解析 — Bundle/条件激活 — 社区 Tap — GEPA 五阶段 — 编写技巧 — 博客实战 — FAQ — 资源链接。
1. 痛点拆解:为什么 Skills 值得单独深入研究?
1)Prompt 是一次性的:每次对话重复 800 字部署说明,Token 浪费且易漏步骤。2)Memory 是事实,不是流程:记住「你喜欢 TypeScript」不等于知道「如何按团队规范开 PR」。3)Token 成本失控:把所有 Runbook 塞进系统提示,Level 0 就吃掉数万 Token。4)无法跨平台复用:各 Agent 各写一套配置,团队无法共享。Hermes Skills 遵循 agentskills.io 开放标准,可在 Hermes、Claude Code、Cursor、OpenCode 之间移植——这才是 2026 年最值得押注的 Agent 基础设施。
2. 核心概念:Skills ≠ Prompts,Skills ≠ Memory
| 维度 | 普通 Prompt | Memory(记忆) | Skills(技能) |
|---|---|---|---|
| 持久性 | 当前对话 | 跨会话,永久 | 跨会话,永久 |
| 加载时机 | 每次都在上下文中 | 每次会话自动注入 | 按需加载(关键差异) |
| Token 成本 | 每次消耗 | 小而稳定 | 激活前零消耗 |
| 内容类型 | 任意意图描述 | 用户偏好/事实 | 程序性步骤(如何做某件事) |
| 谁来维护 | 用户手动 | Agent 自动 | 用户 + Agent 均可 |
| 可共享性 | 不方便 | 私有 | 可发布为社区 Tap |
记忆口诀:Prompt = 便利贴(当次有效);Memory = 便签本(永久笔记,随时在手边);Skill = SOP 手册(步骤化流程,需要时翻阅)。
3. SKILL.md 格式深度解析(agentskills.io 开放标准)
所有 Hermes Skills 遵循 agentskills.io 规范,确保跨 Agent 可移植:
3.1 技能目录结构(模块化设计)
3.2 Progressive Disclosure 三级加载机制
| 加载层级 | 内容 | 触发时机 | Token 成本 |
|---|---|---|---|
| Level 0 | name + description | 每次会话开始,所有技能 | ~3K(全部技能合计) |
| Level 1 | 完整 SKILL.md 正文 | 用户 /skill-name 或 LLM 判断需要 | 取决于文件长度 |
| Level 2 | references/ scripts/ 文件 | LLM 在执行时判断需要 | 按需,单文件 |
写作建议:description 字段是 Level 0 的全部信息,LLM 靠它决定是否加载完整技能。写清「什么时候用」比「是什么」更重要。可用 skills-ref validate ./my-skill 验证格式合规性。
4. Skill Bundles:一条命令触发完整工作流
Skill Bundles 是 Hermes 2026 新增的强力特性。Bundle 是轻量 YAML 文件,把多个相关技能打包成一个斜杠命令。执行 /bundle-name 时,所有列出的技能同时加载,无需逐个触发。文件位置:~/.hermes/skill-bundles/<slug>.yaml
进阶场景示例:AI 研究员工作流可打包 arxiv + deep-research + plan + excalidraw;MLOps 部署流水线可打包 vllm + llama-cpp + github-pr-workflow + systematic-debugging。
Bundle 优先级规则:Bundle 与单个 Skill 同名时,Bundle 优先;Bundle 中未安装的 Skill 跳过而不报错并提示缺失;Bundle 不修改系统提示,不会导致 Prompt Cache 失效(Token 友好)。CLI 快速创建:
5. 条件激活(Conditional Activation):智能感知环境
技能可根据当前会话中工具的可用性,自动显示或隐藏。在 SKILL.md 的 metadata.hermes 下配置:
| 字段 | 行为逻辑 |
|---|---|
requires_toolsets | 列出的工具集不存在时,隐藏此技能 |
requires_tools | 列出的工具不存在时,隐藏此技能 |
fallback_for_toolsets | 列出的工具集存在时,隐藏此技能(作为备选方案) |
fallback_for_tools | 列出的工具存在时,隐藏此技能 |
经典场景——免费/付费工具智能切换:当用户配置了 FIRECRAWL_KEY / BRAVE_SEARCH_KEY 时,付费的 web_search 工具激活,DuckDuckGo 技能(fallback_for_tools: [web_search])自动从提示词中消失,节省 Token;API 不可用时,备选方案自动浮现。通过 hermes skills TUI,还可为 CLI、Telegram、Discord 等平台独立开关某个技能。
6. Skills Hub 与开源社区生态
| 仓库 | 描述 | 亮点 |
|---|---|---|
| awesome-hermes-skills | 精选生产级技能合集 | Deep Research、MLOps、Apple 集成;23 个技能集成 GitHub Copilot |
| hermeshub | 社区技能注册中心 | 安全扫描认证、API 与市场功能、提示注入检测 |
| ai-agent-skills | 191 个技能,28 个分类 | 支持 Hermes/Claude Code/Cursor 一键安装 |
| hermes-agent | 官方主仓库 | 权威来源,含 Skill 编写规范 |
7. 发布你自己的 Skill Tap:团队与社区共享
团队部署流程:
版本管理建议:将 ~/.hermes/skills/ 纳入 Git 版本控制,跨设备 git pull && hermes skills reset 同步后重建内置技能。
8. Self-Evolving Skills:GEPA + DSPy 让技能自动进化
GEPA(Genetic-Pareto Prompt Evolution) 是 2026 年 ICLR Oral 论文成果,Nous Research 集成到 hermes-agent-self-evolution。核心思路:不微调模型权重,只通过分析执行轨迹、生成变体、多目标帕累托优化来改进技能文本本身。成本约 $2–10/次(纯 API 调用,无需 GPU)。
GEPA 五阶段进化流程:
Stage 1 执行轨迹收集(SQLite 数据库,读取全量推理轨迹)→ Stage 2 反思式失败分析(LLM 生成「为什么失败」的可操作侧信息)→ Stage 3 靶向变异(针对失败原因生成 10–20 个 SKILL.md 变体)→ Stage 4 多目标帕累托评估(同时优化成功率 × Token 效率 × 速度)→ Stage 5 人工审查 PR(最优变体生成 PR,人工批准后上线)。
四大安全护栏:① 全量测试套件 pytest tests/ -q 必须 100% 通过;② 大小限制 Skills ≤ 15KB、工具描述 ≤ 500 字符;③ Prompt 缓存兼容性;④ 语义保留检查(不能偏离技能原始核心目的)。
| 阶段 | 优化目标 | 引擎 | 状态 |
|---|---|---|---|
| Phase 1 | Skill 文件(SKILL.md) | DSPy + GEPA | ✅ 已实现 |
| Phase 2 | 工具描述 | DSPy + GEPA | 🔲 计划中 |
| Phase 3 | 系统提示片段 | DSPy + GEPA | 🔲 计划中 |
| Phase 4 | 工具实现代码 | Darwinian Evolver | 🔲 计划中 |
| Phase 5 | 持续改进循环(全自动) | 自动化流水线 | 🔲 计划中 |
9. Plugin 技能:扩展 Hermes 的边界
插件可将技能打包成命名空间形式(plugin:skill),实现:技能不出现在默认 skills_list(减少系统提示噪声);只在用户明确调用时激活(Opt-in);插件内技能可相互引用。加载时自动展示同插件下的兄弟技能。
10. 技能编写进阶技巧(工程师视角)
10.1 description 决定激活精度:❌「Helps with code.」→ ✅「Use when reviewing a pull request, checking for code quality issues, security vulnerabilities... Do NOT use for writing new code.」
10.2 Pitfalls 是质量分水岭:应包含具体失败模式、根因分析、可操作修复步骤(如 CSS selector 脆弱性、GitHub API 限流、大 diff Token 溢出等)。
10.3 脚本化:在 Procedure 中写明 Agent 将执行 scripts/extract_schema.py --input $FILE,失败时加载 references/manual-extract.md。
10.4 技能大小控制:<500 行全放 SKILL.md;500–1000 行移 references/;>1000 行强烈建议拆分;>15KB 超过 GEPA 限制必须拆分。
10.5 skill_manage 让 Agent 自我维护:
11. 实战案例:技术博客工作流 Skills
自定义 seo-keyword-research 技能:在博客写作会话开始时,分别搜索中文长尾(「X 怎么用」「X 教程」)与英文长尾(「X tutorial」「how to X」「X vs Y」),交叉参考掘金热榜、Dev.to trending、HN,输出 3–5 个主关键词 + 10–15 个长尾词矩阵。注意中英文受众搜索同一概念的方式不同(如「Agent」vs「智能体」vs「代理」)。
12. 五步落地清单
Step 1 — 安装 Hermes Agent 并浏览官方 Skills:hermes skills install official/research/arxiv。
Step 2 — 在 ~/.hermes/skills/ 创建第一个 SKILL.md,写好 description 触发条件。
Step 3 — 为常用工作流创建 Bundle YAML,用 hermes bundles create 快速生成。
Step 4 — 配置条件激活(免费/付费工具 fallback),减少 Token 噪声。
Step 5 — 团队共享:创建 Tap 仓库,hermes skills tap add github:your-org/your-skills-tap;进阶用户可克隆 self-evolution 仓库跑 GEPA 优化。
13. FAQ 与可引用数字
Q:Skills 和 MCP 有什么区别? Skills 是程序性知识文档(教 Agent 怎么做),MCP 是工具接口(给 Agent 额外工具调用能力)。两者互补。
Q:为什么 Skill 改了但 Agent 还在用旧版? 当前会话不生效,需 /reset 开新会话,或安装时加 --now(会导致 Prompt Cache 失效)。
Q:GEPA 进化出的技能安全吗? 四大护栏 + 人工 PR 审查;语义漂移检测确保不偏离原始目的。
Q:如何在 Claude Code 中复用 Hermes Skills? 复制 SKILL.md 到 ~/.claude/skills/,或用 ai-agent-skills 一键安装多端。
Q:Skill 中文内容影响 Token 效率吗? 中文字符约 1–1.5 token/字,与英文相近;但 description 建议保留英文,LLM 匹配更精确。
可引用数字:① Hermes Agent 160k+ GitHub Stars(2026 年初,两个月内)。② Level 0 全部技能合计约 ~3K Token。③ GEPA 单次优化成本 $2–10(无需 GPU)。④ GEPA Skills 大小限制 ≤15KB。⑤ ai-agent-skills 仓库 191 个跨平台技能。
14. 延伸阅读与资源
官方:Hermes Agent 文档 · 中文文档 · Skills 系统 · agentskills.io
开源:hermes-agent-self-evolution · gepa-ai/gepa · stanfordnlp/dspy
社区:SegmentFault 中文实战指南 · Dev.to Self-Improving Agent 解剖 · YouTube GEPA & Skill Bundles 教程
15. 深度案例:Hermes Skills + 远程 Mac 7×24 进化闭环
「一家技术媒体团队把博客写作封装成 blog-workflow Bundle:本机 Hermes 负责 SEO 调研与大纲生成(Level 0 仅 ~3K Token 开销),GEPA 每周用真实会话轨迹优化 outline-generator 的 Pitfalls 章节——成功率从 72% 提升到 91%,平均 Token 消耗下降 18%。重脚本(代码验证、多语言发布)放在远程 Mac 节点通过 SSH 执行,本机统一内存不被通宵队列占满。Tap 仓库供 8 人团队 hermes skills tap add 一键同步,私有技能经 GitHub Token 订阅。」
这与本站 OpenRouter Hermes 用量解读、Cursor Agent Skills 指南 形成互补:Cursor Skills 解决 IDE 内按需加载,Hermes Skills + GEPA 解决「越用越强」的闭环。Windows/Linux 也能跑 Hermes CLI,但在 与 Xcode/FCP/ComfyUI 并行、launchd 常驻 Gateway、Metal 侧车推理 场景,macOS 仍更顺滑。若 GEPA 进化或 Bundle 中的重脚本需要长时间跑测试、批量渲染,笔记本统一内存容易被占满——Skill 解决「怎么做」,远程 Mac 解决「在哪跑」。
若你已在用 Hermes Skills 整理工作流,又需要稳定、可租用的 Apple Silicon 算力跑 GEPA 评估、脚本与 7×24 Agent,可考虑 MACGPU 远程 Mac 节点:专跑进化评估与批量任务,本机只保留 Hermes 编排与 Skill 编写——统一内存留给思考,算力留给通宵队列。