2026 HERMES
SKILLS_
GEPA_
EVOLVE.

Hermes Agent Skills 上級ガイド

2026 年初頭、Nous Research が Hermes Agent を公開してからわずか 2 か月で GitHub Star は 16 万超に達し、AI Agent 分野で最も急成長している OSS のひとつとなりました。核心はより大きなモデルではなく、"the agent that grows with you"(使うほどあなたを理解する Agent)という設計思想です。その実装基盤が Skills(スキル)システム——標準化され、進化可能で、セッションをまたいで永続する手続き的メモリです。本稿は入門を飛ばし、上級トピックに直進します。Skills と Memory/Prompt の違い、SKILL.md フォーマットと三段階の漸進読込、Skill Bundles、条件付き活性化、GEPA+DSPy による自己進化、Tap 公開と OSS エコシステムまでを網羅します。結論として、「どうやるか」を移植可能な SKILL.md に書き、Bundles でワークフローを一括ロードし、GEPA でスキルを使うほど改善する——モデル重みを触る必要はありません。 以下では概念対照表、フォーマット解析、Bundle/条件活性化、コミュニティ Tap、GEPA 五段階、執筆テクニック、ブログ実践、FAQ、リソースリンクの順で解説します。

1. 課題整理:なぜ Skills を深く学ぶべきか

1)Prompt は使い捨て:毎セッション 800 字相当のデプロイ手順を繰り返すと Token を浪費し、手順漏れも起きやすくなります。2)Memory は事実であり、手順ではない:「TypeScript が好み」という記憶は、「チーム規約に沿って PR を開く方法」とは別物です。3)Token コストの暴走:すべての Runbook をシステムプロンプトに詰め込むと、Level 0 の時点で数万 Token を消費します。4)プラットフォーム横断の再利用が困難:Agent ごとに別設定を書くと、チームで共有できません。Hermes Skills は agentskills.io の開放標準に準拠しており、Hermes・Claude Code・Cursor・OpenCode 間で移植できます——これこそ 2026 年に投資すべき Agent インフラです。

2. 核心概念:Skills ≠ Prompts、Skills ≠ Memory

観点通常の PromptMemory(記憶)Skills(スキル)
永続性現在の会話のみセッション横断、永続セッション横断、永続
読込タイミング毎回コンテキストに含まれる毎セッション自動注入オンデマンド読込(決定的な差異)
Token コスト毎回消費小さく安定活性化前はゼロ
内容の種類任意の意図記述ユーザー嗜好・事実手続き的ステップ(何かをどうやるか)
保守主体ユーザー手動Agent 自動ユーザー + Agent 双方
共有可能性不便プライベートコミュニティ Tap として公開可能

覚え方:Prompt = 付箋(その場限り);Memory = ノート(常に手元にある永久メモ);Skill = SOP マニュアル(必要なときだけ開く手順書)。

3. SKILL.md フォーマット詳解(agentskills.io 開放標準)

すべての Hermes Skills は agentskills.io 仕様に従い、Agent 間の移植性を確保します。

--- name: my-skill # 必須:小文字+ハイフン、≤64文字 description: | # 必須:≤1024文字、「Use when...」推奨 Use when the user needs to [...]. Handles [...] and [...]. version: 1.0.0 license: MIT compatibility: Requires git, docker allowed-tools: Bash(git:*) Read # ツール事前承認(実験的) metadata: hermes: tags: [devops, automation] category: software-development related_skills: [github-pr-workflow, test-driven-development] requires_toolsets: [terminal] fallback_for_toolsets: [web] --- # My Skill Title ## Overview 1-2 paragraphs: what it does and why it exists. ## When to Use - Use for: [具体的なシーン] - Don't use for: [明確な除外シーン] ## Procedure 1. ステップ一(正確なコマンドを含む) 2. ステップ二 3. ステップ三 ## Common Pitfalls 1. よくある問題と修正方法 ## Verification Checklist - [ ] 検証ポイント 1 - [ ] 検証ポイント 2

3.1 スキルディレクトリ構造(モジュール設計)

~/.hermes/skills/ └── my-category/ └── my-skill/ ├── SKILL.md # メインファイル(核心ステップ、≤500行推奨) ├── references/ │ ├── api-docs.md # API リファレンス(オンデマンド読込) │ └── examples.md ├── templates/ │ └── config.yaml └── scripts/ └── setup.sh # Agent が直接実行できるスクリプト

3.2 Progressive Disclosure(漸進開示)三段階読込

読込レベル内容トリガーToken コスト
Level 0name + descriptionセッション開始時、全スキル~3K(全スキル合計)
Level 1SKILL.md 本文全体ユーザーが /skill-name または LLM が必要と判断ファイル長に依存
Level 2references/ scripts/ ファイルLLM が実行中に必要と判断オンデマンド、単一ファイル

執筆のコツ:description フィールドは Level 0 の唯一の情報源です。LLM はこれを見てフルスキルを読み込むか決めます。「いつ使うか」を「何か」より明確に書くことが重要です。skills-ref validate ./my-skill でフォーマットの妥当性を検証できます。

4. Skill Bundles:ワンコマンドでワークフロー全体を起動

Skill Bundles は Hermes 2026 の強力な新機能です。Bundle は軽量 YAML ファイルで、複数の関連スキルをひとつのスラッシュコマンドにまとめます。/bundle-name 実行時、列挙されたスキルが同時に読み込まれ、個別トリガーは不要です。配置場所:~/.hermes/skill-bundles/<slug>.yaml

name: backend-dev description: | Full backend feature workflow — code review, TDD, and PR management. skills: - github-code-review - test-driven-development - github-pr-workflow instruction: | Always write failing tests first before implementation. Open PRs with co-author tags for pair-programming sessions. Never push directly to main.

上級シーン例:AI リサーチャーワークフローには arxiv + deep-research + plan + excalidraw をパッケージ化;MLOps デプロイパイプラインには vllm + llama-cpp + github-pr-workflow + systematic-debugging を組み合わせます。

Bundle 優先ルール:Bundle と単一 Skill が同名の場合、Bundle が優先されます。Bundle 内の未インストール Skill はエラーにせずスキップし、欠落を通知します。Bundle はシステムプロンプトを変更しないため、Prompt Cache を壊しません(Token フレンドリー)。CLI での迅速作成:

hermes bundles create backend-dev \ --skills github-code-review,test-driven-development,github-pr-workflow \ --instruction "Always write failing tests first"

5. 条件付き活性化(Conditional Activation):環境を賢く感知

スキルは現在のセッションで利用可能なツールに応じて、自動的に表示または非表示になります。SKILL.md の metadata.hermes 下で設定します。

フィールド動作ロジック
requires_toolsets列挙したツールセットが存在しない場合、このスキルを非表示
requires_tools列挙したツールが存在しない場合、このスキルを非表示
fallback_for_toolsets列挙したツールセットが存在する場合、このスキルを非表示(代替案として)
fallback_for_tools列挙したツールが存在する場合、このスキルを非表示

典型シーン——無料/有料ツールの自動切替:FIRECRAWL_KEY / BRAVE_SEARCH_KEY が設定されていると、有料の web_search ツールが活性化し、DuckDuckGo スキル(fallback_for_tools: [web_search])はプロンプトから自動的に消え、Token を節約します。API が使えない場合は代替案が自動的に浮上します。hermes skills TUI では、CLI・Telegram・Discord などプラットフォームごとにスキルのオン/オフも個別設定できます。

6. Skills Hub と OSS コミュニティエコシステム

# 公式オプションスキルをインストール hermes skills install official/research/arxiv # HTTP URL から直接インストール hermes skills install https://example.com/SKILL.md --name my-skill # GitHub リポジトリからインストール hermes skills install github:openai/skills/k8s # カスタム Tap を追加(スキルリポジトリ全体を購読) hermes skills tap add github:my-org/my-skills
リポジトリ説明ハイライト
awesome-hermes-skills厳選された本番向けスキル集Deep Research、MLOps、Apple 連携;23 スキルが GitHub Copilot と統合
hermeshubコミュニティスキル登録センターセキュリティスキャン認証、API・マーケット機能、プロンプトインジェクション検出
ai-agent-skills191 スキル、28 カテゴリHermes/Claude Code/Cursor へのワンクリックインストール対応
hermes-agent公式メインリポジトリ権威ある情報源、Skill 執筆規約を含む

7. 独自 Skill Tap の公開:チームとコミュニティ共有

my-skills-tap/ ├── skills.sh.json # カテゴリ設定(任意) ├── mlops/ │ ├── vllm-deploy/SKILL.md │ └── model-benchmark/SKILL.md ├── research/ │ ├── paper-summarizer/SKILL.md │ └── citation-finder/SKILL.md └── README.md

チーム展開の手順:

# チームメンバーがワンクリック購読 hermes skills tap add github:your-org/your-skills-tap # プライベートリポジトリ(GitHub Token が必要) hermes skills tap add github:your-org/private-skills --token $GH_TOKEN # すべての Tap スキルを更新 hermes skills tap update # 購読中の Tap を確認 hermes skills tap list

バージョン管理の推奨:~/.hermes/skills/ を Git で管理し、デバイス間で git pull && hermes skills reset 後に同期し、組み込みスキルを再構築します。

8. Self-Evolving Skills:GEPA + DSPy でスキルを自動進化

GEPA(Genetic-Pareto Prompt Evolution) は 2026 年 ICLR Oral 論文の成果で、Nous Research が hermes-agent-self-evolution に統合しました。核心はモデル重みを微調整せず、実行トレースの分析・変異生成・多目的パレート最適化によってスキルテキスト自体を改善することです。コストは約 $2–10/回(純粋な API 呼び出し、GPU 不要)。

GEPA 五段階進化フロー:

Stage 1 実行トレース収集(SQLite データベース、全推論トレースを読取)→ Stage 2 反省的失敗分析(LLM が「なぜ失敗したか」の actionable な洞察を生成)→ Stage 3 ターゲット変異(失敗原因に対し 10–20 個の SKILL.md 変異を生成)→ Stage 4 多目的パレート評価(成功率 × Token 効率 × 速度を同時最適化)→ Stage 5 人手 PR レビュー(最良変異が PR を生成し、承認後に本番投入)。

git clone https://github.com/NousResearch/hermes-agent-self-evolution cd hermes-agent-self-evolution && pip install -r requirements.txt export HERMES_AGENT_PATH=~/.hermes # 合成データ進化(入門推奨) python -m evolution.skills.evolve_skill \ --skill github-code-review --iterations 10 --eval-source synthetic # 実セッションデータ(効果がより高い) python -m evolution.skills.evolve_skill \ --skill github-code-review --iterations 10 --eval-source sessiondb # Claude Code / Gemini トレース併用(実験的) python -m evolution.skills.evolve_skill \ --skill github-code-review --iterations 10 --eval-source mixed \ --trace-dirs ~/.claude/traces,~/.hermes/sessions

四大セーフガード:① 全テストスイート pytest tests/ -q が 100% パス必須;② サイズ制限 Skills ≤ 15KB、ツール説明 ≤ 500 文字;③ Prompt キャッシュ互換性;④ 意味保持チェック(スキルの本来目的から逸脱しない)。

フェーズ最適化対象エンジン状態
Phase 1Skill ファイル(SKILL.md)DSPy + GEPA✅ 実装済み
Phase 2ツール説明DSPy + GEPA🔲 計画中
Phase 3システムプロンプト断片DSPy + GEPA🔲 計画中
Phase 4ツール実装コードDarwinian Evolver🔲 計画中
Phase 5継続改善ループ(全自動)自動化パイプライン🔲 計画中

9. Plugin スキル:Hermes の境界を拡張

プラグインはスキルを名前空間形式(plugin:skill)でパッケージ化し、以下を実現します:デフォルトの skills_list に表示されない(システムプロンプトのノイズ削減);ユーザーが明示的に呼び出したときだけ活性化(Opt-in);プラグイン内スキル同士の相互参照。読込時に同一プラグイン内の兄弟スキルも自動表示されます。

# プラグインスキルを読込(名前空間形式) skill_view("superpowers:writing-plans") # plugin.yaml でスキルを宣言 name: my-hermes-plugin skills: - name: writing-plans path: skills/writing-plans/SKILL.md - name: editing path: skills/editing/SKILL.md

10. スキル執筆の上級テクニック(エンジニア視点)

10.1 description が活性化精度を決める:❌「Helps with code.」→ ✅「Use when reviewing a pull request, checking for code quality issues, security vulnerabilities... Do NOT use for writing new code.」

10.2 Pitfalls が品質の分水嶺:具体的な失敗パターン、根本原因分析、実行可能な修正手順を含めるべきです(CSS セレクタの脆弱性、GitHub API レート制限、大きな diff による Token オーバーフローなど)。

10.3 スクリプト化:Procedure に Agent が scripts/extract_schema.py --input $FILE を実行すると明記し、失敗時は references/manual-extract.md を読み込むよう指示します。

10.4 スキルサイズ管理:<500 行は SKILL.md に集約;500–1000 行は references/ へ移動;>1000 行は強く分割を推奨;>15KB は GEPA 制限超過のため必ず分割します。

10.5 skill_manage で Agent が自己保守:

skill_manage(action='patch', name='github-code-review', old_string='Check for obvious bugs', new_string='Check for: null pointer, SQL injection, XSS, logic errors') # 人手承認ゲートを有効化 # config.yaml: skills.agent_writes_require_approval: true

11. 実践ケース:技術ブログワークフロー Skills

# ~/.hermes/skill-bundles/blog-workflow.yaml name: blog-workflow description: Full tech blog writing workflow. skills: - seo-keyword-research - outline-generator - code-example-validator - bilingual-checker - publish-to-platform instruction: | Always research SEO keywords before writing. Ensure all code examples are tested and runnable. Generate both Japanese and English title options.

カスタム seo-keyword-research スキル:ブログ執筆セッション開始時に、日本語ロングテール(「X 使い方」「X チュートリアル」)と英語ロングテール(「X tutorial」「how to X」「X vs Y」)をそれぞれ検索し、Zenn トレンド、Dev.to trending、HN をクロスリファレンスして、3–5 個の主キーワード + 10–15 個のロングテール語マトリクスを出力します。日英の読者が同一概念を異なる語で検索する点(「Agent」vs「エージェント」vs「代理」)にも注意が必要です。

12. 五段階ロードマップ(実装チェックリスト)

Step 1 — Hermes Agent をインストールし、公式 Skills を確認します:hermes skills install official/research/arxiv
Step 2~/.hermes/skills/ に最初の SKILL.md を作成し、description にトリガー条件を明記します。
Step 3 — よく使うワークフロー用に Bundle YAML を作成し、hermes bundles create で迅速生成します。
Step 4 — 条件付き活性化(無料/有料ツール fallback)を設定し、Token ノイズを削減します。
Step 5 — チーム共有:Tap リポジトリを作成し、hermes skills tap add github:your-org/your-skills-tap を実行;上級ユーザーは self-evolution リポジトリをクローンして GEPA 最適化を回します。

13. FAQ と引用可能な数値

Q:Skills と MCP の違いは? Skills は手続き的知識ドキュメント(Agent に「どうやるか」を教える)、MCP はツールインターフェース(Agent に追加のツール呼び出し能力を与える)です。両者は補完関係にあります。
Q:Skill を更新したのに Agent が旧版を使うのはなぜ? 現在のセッションには反映されません。/reset で新セッションを開くか、インストール時に --now を付与してください(Prompt Cache が無効化されます)。
Q:GEPA で進化したスキルは安全か? 四大セーフガード + 人手 PR レビュー;意味ドリフト検出により本来目的からの逸脱を防ぎます。
Q:Claude Code で Hermes Skills を再利用するには? SKILL.md を ~/.claude/skills/ にコピーするか、ai-agent-skills でマルチプラットフォーム一括インストールします。
Q:Skill の日本語コンテンツは Token 効率に影響するか? 日本語は約 1–1.5 token/字で英語と近いですが、description は英語のままにすると LLM のマッチ精度が高まります。

引用可能な数値:① Hermes Agent 160k+ GitHub Stars(2026 年初頭、2 か月以内)。② Level 0 全スキル合計約 ~3K Token。③ GEPA 単回最適化コスト $2–10(GPU 不要)。④ GEPA Skills サイズ制限 ≤15KB。⑤ ai-agent-skills リポジトリ 191 個のクロスプラットフォームスキル。

14. 参考資料と外部リンク

公式:Hermes Agent ドキュメント · 日本語ドキュメント · Skills システム · agentskills.io
OSS:hermes-agent-self-evolution · gepa-ai/gepa · stanfordnlp/dspy
コミュニティ:Zenn 実践ガイド · Dev.to Self-Improving Agent 解剖 · YouTube GEPA & Skill Bundles チュートリアル

15. 深度ケース:Hermes Skills + リモート Mac 7×24 進化ループ

「ある技術メディアチームがブログ執筆を blog-workflow Bundle に封じ込めました。ローカル Hermes が SEO 調査とアウトライン生成を担当(Level 0 は ~3K Token のみ)、GEPA が毎週実セッショントレースで outline-generator の Pitfalls 章を最適化——成功率は 72% から 91% に、平均 Token 消費は 18% 削減。重いスクリプト(コード検証、多言語公開)はリモート Mac ノードで SSH 実行し、ローカルのユニファイドメモリを夜間キューで占有しません。Tap リポジトリで 8 人チームが hermes skills tap add でワンクリック同期、プライベートスキルは GitHub Token で購読。」

これは当サイトの OpenRouter Hermes 用量解説Cursor Agent Skills ガイド と補完関係にあります。Cursor Skills は IDE 内のオンデマンド読込を解決し、Hermes Skills + GEPA は「使うほど強くなる」ループを解決します。Windows/Linux でも Hermes CLI は動きますが、Xcode/FCP/ComfyUI との並行、launchd 常駐 Gateway、Metal サイドカー推論のシーンでは macOS が依然としてスムーズです。GEPA 進化や Bundle 内の重いスクリプトが長時間のテスト・バッチレンダリングを要する場合、ノート PC のユニファイドメモリは占有されやすくなります——Skill は「どうやるか」を、リモート Mac は「どこで走らせるか」を解決します

すでに Hermes Skills でワークフローを整理しており、GEPA 評価・スクリプト・7×24 Agent に安定して借りられる Apple Silicon 算力が必要な場合は、MACGPU リモート Mac ノードの検討をおすすめします。進化評価とバッチタスクを専用ノードに任せ、ローカルには Hermes のオーケストレーションと Skill 執筆だけを残す——ユニファイドメモリは思考に、算力は夜間キューに。