2026年 Hermes Agent Skills 上級ガイド：SKILL.md から GEPA 自己進化まで

2026 年初頭、Nous Research が Hermes Agent を公開してからわずか 2 か月で GitHub Star は 16 万超に達し、AI Agent 分野で最も急成長している OSS のひとつとなりました。核心はより大きなモデルではなく、"the agent that grows with you"（使うほどあなたを理解する Agent）という設計思想です。その実装基盤が Skills（スキル）システム——標準化され、進化可能で、セッションをまたいで永続する手続き的メモリです。本稿は入門を飛ばし、上級トピックに直進します。Skills と Memory/Prompt の違い、SKILL.md フォーマットと三段階の漸進読込、Skill Bundles、条件付き活性化、GEPA+DSPy による自己進化、Tap 公開と OSS エコシステムまでを網羅します。結論として、「どうやるか」を移植可能な SKILL.md に書き、Bundles でワークフローを一括ロードし、GEPA でスキルを使うほど改善する——モデル重みを触る必要はありません。以下では概念対照表、フォーマット解析、Bundle/条件活性化、コミュニティ Tap、GEPA 五段階、執筆テクニック、ブログ実践、FAQ、リソースリンクの順で解説します。

1. 課題整理：なぜ Skills を深く学ぶべきか

1）Prompt は使い捨て：毎セッション 800 字相当のデプロイ手順を繰り返すと Token を浪費し、手順漏れも起きやすくなります。2）Memory は事実であり、手順ではない：「TypeScript が好み」という記憶は、「チーム規約に沿って PR を開く方法」とは別物です。3）Token コストの暴走：すべての Runbook をシステムプロンプトに詰め込むと、Level 0 の時点で数万 Token を消費します。4）プラットフォーム横断の再利用が困難：Agent ごとに別設定を書くと、チームで共有できません。Hermes Skills は agentskills.io の開放標準に準拠しており、Hermes・Claude Code・Cursor・OpenCode 間で移植できます——これこそ 2026 年に投資すべき Agent インフラです。

2. 核心概念：Skills ≠ Prompts、Skills ≠ Memory

観点	通常の Prompt	Memory（記憶）	Skills（スキル）
永続性	現在の会話のみ	セッション横断、永続	セッション横断、永続
読込タイミング	毎回コンテキストに含まれる	毎セッション自動注入	オンデマンド読込（決定的な差異）
Token コスト	毎回消費	小さく安定	活性化前はゼロ
内容の種類	任意の意図記述	ユーザー嗜好・事実	手続き的ステップ（何かをどうやるか）
保守主体	ユーザー手動	Agent 自動	ユーザー + Agent 双方
共有可能性	不便	プライベート	コミュニティ Tap として公開可能

覚え方：Prompt = 付箋（その場限り）；Memory = ノート（常に手元にある永久メモ）；Skill = SOP マニュアル（必要なときだけ開く手順書）。

3. SKILL.md フォーマット詳解（agentskills.io 開放標準）

すべての Hermes Skills は agentskills.io 仕様に従い、Agent 間の移植性を確保します。

---
name: my-skill                    # 必須：小文字+ハイフン、≤64文字
description: |                    # 必須：≤1024文字、「Use when...」推奨
  Use when the user needs to [...].
  Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read   # ツール事前承認（実験的）
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow, test-driven-development]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

# My Skill Title

## Overview
1-2 paragraphs: what it does and why it exists.

## When to Use
- Use for: [具体的なシーン]
- Don't use for: [明確な除外シーン]

## Procedure
1. ステップ一（正確なコマンドを含む）
2. ステップ二
3. ステップ三

## Common Pitfalls
1. よくある問題と修正方法

## Verification Checklist
- [ ] 検証ポイント 1
- [ ] 検証ポイント 2

3.1 スキルディレクトリ構造（モジュール設計）

~/.hermes/skills/
└── my-category/
    └── my-skill/
        ├── SKILL.md              # メインファイル（核心ステップ、≤500行推奨）
        ├── references/
        │   ├── api-docs.md       # API リファレンス（オンデマンド読込）
        │   └── examples.md
        ├── templates/
        │   └── config.yaml
        └── scripts/
            └── setup.sh          # Agent が直接実行できるスクリプト

3.2 Progressive Disclosure（漸進開示）三段階読込

読込レベル	内容	トリガー	Token コスト
Level 0	`name` + `description`	セッション開始時、全スキル	~3K（全スキル合計）
Level 1	SKILL.md 本文全体	ユーザーが `/skill-name` または LLM が必要と判断	ファイル長に依存
Level 2	references/ scripts/ ファイル	LLM が実行中に必要と判断	オンデマンド、単一ファイル

執筆のコツ：description フィールドは Level 0 の唯一の情報源です。LLM はこれを見てフルスキルを読み込むか決めます。「いつ使うか」を「何か」より明確に書くことが重要です。skills-ref validate ./my-skill でフォーマットの妥当性を検証できます。

4. Skill Bundles：ワンコマンドでワークフロー全体を起動

Skill Bundles は Hermes 2026 の強力な新機能です。Bundle は軽量 YAML ファイルで、複数の関連スキルをひとつのスラッシュコマンドにまとめます。/bundle-name 実行時、列挙されたスキルが同時に読み込まれ、個別トリガーは不要です。配置場所：~/.hermes/skill-bundles/<slug>.yaml

name: backend-dev
description: |
  Full backend feature workflow — code review, TDD, and PR management.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Open PRs with co-author tags for pair-programming sessions.
  Never push directly to main.

上級シーン例：AI リサーチャーワークフローには arxiv + deep-research + plan + excalidraw をパッケージ化；MLOps デプロイパイプラインには vllm + llama-cpp + github-pr-workflow + systematic-debugging を組み合わせます。

Bundle 優先ルール：Bundle と単一 Skill が同名の場合、Bundle が優先されます。Bundle 内の未インストール Skill はエラーにせずスキップし、欠落を通知します。Bundle はシステムプロンプトを変更しないため、Prompt Cache を壊しません（Token フレンドリー）。CLI での迅速作成：

hermes bundles create backend-dev \
  --skills github-code-review,test-driven-development,github-pr-workflow \
  --instruction "Always write failing tests first"

5. 条件付き活性化（Conditional Activation）：環境を賢く感知

スキルは現在のセッションで利用可能なツールに応じて、自動的に表示または非表示になります。SKILL.md の metadata.hermes 下で設定します。

フィールド	動作ロジック
`requires_toolsets`	列挙したツールセットが存在しない場合、このスキルを非表示
`requires_tools`	列挙したツールが存在しない場合、このスキルを非表示
`fallback_for_toolsets`	列挙したツールセットが存在する場合、このスキルを非表示（代替案として）
`fallback_for_tools`	列挙したツールが存在する場合、このスキルを非表示

典型シーン——無料/有料ツールの自動切替：FIRECRAWL_KEY / BRAVE_SEARCH_KEY が設定されていると、有料の web_search ツールが活性化し、DuckDuckGo スキル（fallback_for_tools: [web_search]）はプロンプトから自動的に消え、Token を節約します。API が使えない場合は代替案が自動的に浮上します。hermes skills TUI では、CLI・Telegram・Discord などプラットフォームごとにスキルのオン/オフも個別設定できます。

6. Skills Hub と OSS コミュニティエコシステム

# 公式オプションスキルをインストール
hermes skills install official/research/arxiv

# HTTP URL から直接インストール
hermes skills install https://example.com/SKILL.md --name my-skill

# GitHub リポジトリからインストール
hermes skills install github:openai/skills/k8s

# カスタム Tap を追加（スキルリポジトリ全体を購読）
hermes skills tap add github:my-org/my-skills

リポジトリ	説明	ハイライト
awesome-hermes-skills	厳選された本番向けスキル集	Deep Research、MLOps、Apple 連携；23 スキルが GitHub Copilot と統合
hermeshub	コミュニティスキル登録センター	セキュリティスキャン認証、API・マーケット機能、プロンプトインジェクション検出
ai-agent-skills	191 スキル、28 カテゴリ	Hermes/Claude Code/Cursor へのワンクリックインストール対応
hermes-agent	公式メインリポジトリ	権威ある情報源、Skill 執筆規約を含む

7. 独自 Skill Tap の公開：チームとコミュニティ共有

my-skills-tap/
├── skills.sh.json              # カテゴリ設定（任意）
├── mlops/
│   ├── vllm-deploy/SKILL.md
│   └── model-benchmark/SKILL.md
├── research/
│   ├── paper-summarizer/SKILL.md
│   └── citation-finder/SKILL.md
└── README.md

チーム展開の手順：

# チームメンバーがワンクリック購読
hermes skills tap add github:your-org/your-skills-tap

# プライベートリポジトリ（GitHub Token が必要）
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN

# すべての Tap スキルを更新
hermes skills tap update

# 購読中の Tap を確認
hermes skills tap list

バージョン管理の推奨：~/.hermes/skills/ を Git で管理し、デバイス間で git pull && hermes skills reset 後に同期し、組み込みスキルを再構築します。

8. Self-Evolving Skills：GEPA + DSPy でスキルを自動進化

GEPA（Genetic-Pareto Prompt Evolution） は 2026 年 ICLR Oral 論文の成果で、Nous Research が hermes-agent-self-evolution に統合しました。核心はモデル重みを微調整せず、実行トレースの分析・変異生成・多目的パレート最適化によってスキルテキスト自体を改善することです。コストは約 $2–10/回（純粋な API 呼び出し、GPU 不要）。

GEPA 五段階進化フロー：

Stage 1 実行トレース収集（SQLite データベース、全推論トレースを読取）→ Stage 2 反省的失敗分析（LLM が「なぜ失敗したか」の actionable な洞察を生成）→ Stage 3 ターゲット変異（失敗原因に対し 10–20 個の SKILL.md 変異を生成）→ Stage 4 多目的パレート評価（成功率 × Token 効率 × 速度を同時最適化）→ Stage 5 人手 PR レビュー（最良変異が PR を生成し、承認後に本番投入）。

git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes

# 合成データ進化（入門推奨）
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source synthetic

# 実セッションデータ（効果がより高い）
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source sessiondb

# Claude Code / Gemini トレース併用（実験的）
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source mixed \
    --trace-dirs ~/.claude/traces,~/.hermes/sessions

四大セーフガード：① 全テストスイート pytest tests/ -q が 100% パス必須；② サイズ制限 Skills ≤ 15KB、ツール説明 ≤ 500 文字；③ Prompt キャッシュ互換性；④ 意味保持チェック（スキルの本来目的から逸脱しない）。

フェーズ	最適化対象	エンジン	状態
Phase 1	Skill ファイル（SKILL.md）	DSPy + GEPA	✅ 実装済み
Phase 2	ツール説明	DSPy + GEPA	🔲 計画中
Phase 3	システムプロンプト断片	DSPy + GEPA	🔲 計画中
Phase 4	ツール実装コード	Darwinian Evolver	🔲 計画中
Phase 5	継続改善ループ（全自動）	自動化パイプライン	🔲 計画中

9. Plugin スキル：Hermes の境界を拡張

プラグインはスキルを名前空間形式（plugin:skill）でパッケージ化し、以下を実現します：デフォルトの skills_list に表示されない（システムプロンプトのノイズ削減）；ユーザーが明示的に呼び出したときだけ活性化（Opt-in）；プラグイン内スキル同士の相互参照。読込時に同一プラグイン内の兄弟スキルも自動表示されます。

# プラグインスキルを読込（名前空間形式）
skill_view("superpowers:writing-plans")

# plugin.yaml でスキルを宣言
name: my-hermes-plugin
skills:
  - name: writing-plans
    path: skills/writing-plans/SKILL.md
  - name: editing
    path: skills/editing/SKILL.md

10. スキル執筆の上級テクニック（エンジニア視点）

10.1 description が活性化精度を決める：❌「Helps with code.」→ ✅「Use when reviewing a pull request, checking for code quality issues, security vulnerabilities... Do NOT use for writing new code.」

10.2 Pitfalls が品質の分水嶺：具体的な失敗パターン、根本原因分析、実行可能な修正手順を含めるべきです（CSS セレクタの脆弱性、GitHub API レート制限、大きな diff による Token オーバーフローなど）。

10.3 スクリプト化：Procedure に Agent が scripts/extract_schema.py --input $FILE を実行すると明記し、失敗時は references/manual-extract.md を読み込むよう指示します。

10.4 スキルサイズ管理：<500 行は SKILL.md に集約；500–1000 行は references/ へ移動；>1000 行は強く分割を推奨；>15KB は GEPA 制限超過のため必ず分割します。

10.5 skill_manage で Agent が自己保守：

skill_manage(action='patch', name='github-code-review',
    old_string='Check for obvious bugs',
    new_string='Check for: null pointer, SQL injection, XSS, logic errors')

# 人手承認ゲートを有効化
# config.yaml: skills.agent_writes_require_approval: true

11. 実践ケース：技術ブログワークフロー Skills

# ~/.hermes/skill-bundles/blog-workflow.yaml
name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.
  Generate both Japanese and English title options.

カスタム seo-keyword-research スキル：ブログ執筆セッション開始時に、日本語ロングテール（「X 使い方」「X チュートリアル」）と英語ロングテール（「X tutorial」「how to X」「X vs Y」）をそれぞれ検索し、Zenn トレンド、Dev.to trending、HN をクロスリファレンスして、3–5 個の主キーワード + 10–15 個のロングテール語マトリクスを出力します。日英の読者が同一概念を異なる語で検索する点（「Agent」vs「エージェント」vs「代理」）にも注意が必要です。

12. 五段階ロードマップ（実装チェックリスト）

Step 1 — Hermes Agent をインストールし、公式 Skills を確認します：hermes skills install official/research/arxiv。
Step 2 — ~/.hermes/skills/ に最初の SKILL.md を作成し、description にトリガー条件を明記します。
Step 3 — よく使うワークフロー用に Bundle YAML を作成し、hermes bundles create で迅速生成します。
Step 4 — 条件付き活性化（無料/有料ツール fallback）を設定し、Token ノイズを削減します。
Step 5 — チーム共有：Tap リポジトリを作成し、hermes skills tap add github:your-org/your-skills-tap を実行；上級ユーザーは self-evolution リポジトリをクローンして GEPA 最適化を回します。

13. FAQ と引用可能な数値

Q：Skills と MCP の違いは？ Skills は手続き的知識ドキュメント（Agent に「どうやるか」を教える）、MCP はツールインターフェース（Agent に追加のツール呼び出し能力を与える）です。両者は補完関係にあります。
Q：Skill を更新したのに Agent が旧版を使うのはなぜ？ 現在のセッションには反映されません。/reset で新セッションを開くか、インストール時に --now を付与してください（Prompt Cache が無効化されます）。
Q：GEPA で進化したスキルは安全か？ 四大セーフガード + 人手 PR レビュー；意味ドリフト検出により本来目的からの逸脱を防ぎます。
Q：Claude Code で Hermes Skills を再利用するには？ SKILL.md を ~/.claude/skills/ にコピーするか、ai-agent-skills でマルチプラットフォーム一括インストールします。
Q：Skill の日本語コンテンツは Token 効率に影響するか？ 日本語は約 1–1.5 token/字で英語と近いですが、description は英語のままにすると LLM のマッチ精度が高まります。

引用可能な数値：① Hermes Agent 160k+ GitHub Stars（2026 年初頭、2 か月以内）。② Level 0 全スキル合計約 ~3K Token。③ GEPA 単回最適化コスト $2–10（GPU 不要）。④ GEPA Skills サイズ制限 ≤15KB。⑤ ai-agent-skills リポジトリ 191 個のクロスプラットフォームスキル。

14. 参考資料と外部リンク

公式：Hermes Agent ドキュメント · 日本語ドキュメント · Skills システム · agentskills.io
OSS：hermes-agent-self-evolution · gepa-ai/gepa · stanfordnlp/dspy
コミュニティ：Zenn 実践ガイド · Dev.to Self-Improving Agent 解剖 · YouTube GEPA & Skill Bundles チュートリアル

15. 深度ケース：Hermes Skills + リモート Mac 7×24 進化ループ

「ある技術メディアチームがブログ執筆を blog-workflow Bundle に封じ込めました。ローカル Hermes が SEO 調査とアウトライン生成を担当（Level 0 は ~3K Token のみ）、GEPA が毎週実セッショントレースで outline-generator の Pitfalls 章を最適化——成功率は 72% から 91% に、平均 Token 消費は 18% 削減。重いスクリプト（コード検証、多言語公開）はリモート Mac ノードで SSH 実行し、ローカルのユニファイドメモリを夜間キューで占有しません。Tap リポジトリで 8 人チームが hermes skills tap add でワンクリック同期、プライベートスキルは GitHub Token で購読。」

これは当サイトの OpenRouter Hermes 用量解説、Cursor Agent Skills ガイドと補完関係にあります。Cursor Skills は IDE 内のオンデマンド読込を解決し、Hermes Skills + GEPA は「使うほど強くなる」ループを解決します。Windows/Linux でも Hermes CLI は動きますが、Xcode/FCP/ComfyUI との並行、launchd 常駐 Gateway、Metal サイドカー推論のシーンでは macOS が依然としてスムーズです。GEPA 進化や Bundle 内の重いスクリプトが長時間のテスト・バッチレンダリングを要する場合、ノート PC のユニファイドメモリは占有されやすくなります——Skill は「どうやるか」を、リモート Mac は「どこで走らせるか」を解決します。

すでに Hermes Skills でワークフローを整理しており、GEPA 評価・スクリプト・7×24 Agent に安定して借りられる Apple Silicon 算力が必要な場合は、MACGPU リモート Mac ノードの検討をおすすめします。進化評価とバッチタスクを専用ノードに任せ、ローカルには Hermes のオーケストレーションと Skill 執筆だけを残す——ユニファイドメモリは思考に、算力は夜間キューに。