2026 HERMES
SKILLS_
GEPA_
EVOLVE.
2026 年初頭、Nous Research が Hermes Agent を公開してからわずか 2 か月で GitHub Star は 16 万超に達し、AI Agent 分野で最も急成長している OSS のひとつとなりました。核心はより大きなモデルではなく、"the agent that grows with you"(使うほどあなたを理解する Agent)という設計思想です。その実装基盤が Skills(スキル)システム——標準化され、進化可能で、セッションをまたいで永続する手続き的メモリです。本稿は入門を飛ばし、上級トピックに直進します。Skills と Memory/Prompt の違い、SKILL.md フォーマットと三段階の漸進読込、Skill Bundles、条件付き活性化、GEPA+DSPy による自己進化、Tap 公開と OSS エコシステムまでを網羅します。結論として、「どうやるか」を移植可能な SKILL.md に書き、Bundles でワークフローを一括ロードし、GEPA でスキルを使うほど改善する——モデル重みを触る必要はありません。 以下では概念対照表、フォーマット解析、Bundle/条件活性化、コミュニティ Tap、GEPA 五段階、執筆テクニック、ブログ実践、FAQ、リソースリンクの順で解説します。
1. 課題整理:なぜ Skills を深く学ぶべきか
1)Prompt は使い捨て:毎セッション 800 字相当のデプロイ手順を繰り返すと Token を浪費し、手順漏れも起きやすくなります。2)Memory は事実であり、手順ではない:「TypeScript が好み」という記憶は、「チーム規約に沿って PR を開く方法」とは別物です。3)Token コストの暴走:すべての Runbook をシステムプロンプトに詰め込むと、Level 0 の時点で数万 Token を消費します。4)プラットフォーム横断の再利用が困難:Agent ごとに別設定を書くと、チームで共有できません。Hermes Skills は agentskills.io の開放標準に準拠しており、Hermes・Claude Code・Cursor・OpenCode 間で移植できます——これこそ 2026 年に投資すべき Agent インフラです。
2. 核心概念:Skills ≠ Prompts、Skills ≠ Memory
| 観点 | 通常の Prompt | Memory(記憶) | Skills(スキル) |
|---|---|---|---|
| 永続性 | 現在の会話のみ | セッション横断、永続 | セッション横断、永続 |
| 読込タイミング | 毎回コンテキストに含まれる | 毎セッション自動注入 | オンデマンド読込(決定的な差異) |
| Token コスト | 毎回消費 | 小さく安定 | 活性化前はゼロ |
| 内容の種類 | 任意の意図記述 | ユーザー嗜好・事実 | 手続き的ステップ(何かをどうやるか) |
| 保守主体 | ユーザー手動 | Agent 自動 | ユーザー + Agent 双方 |
| 共有可能性 | 不便 | プライベート | コミュニティ Tap として公開可能 |
覚え方:Prompt = 付箋(その場限り);Memory = ノート(常に手元にある永久メモ);Skill = SOP マニュアル(必要なときだけ開く手順書)。
3. SKILL.md フォーマット詳解(agentskills.io 開放標準)
すべての Hermes Skills は agentskills.io 仕様に従い、Agent 間の移植性を確保します。
3.1 スキルディレクトリ構造(モジュール設計)
3.2 Progressive Disclosure(漸進開示)三段階読込
| 読込レベル | 内容 | トリガー | Token コスト |
|---|---|---|---|
| Level 0 | name + description | セッション開始時、全スキル | ~3K(全スキル合計) |
| Level 1 | SKILL.md 本文全体 | ユーザーが /skill-name または LLM が必要と判断 | ファイル長に依存 |
| Level 2 | references/ scripts/ ファイル | LLM が実行中に必要と判断 | オンデマンド、単一ファイル |
執筆のコツ:description フィールドは Level 0 の唯一の情報源です。LLM はこれを見てフルスキルを読み込むか決めます。「いつ使うか」を「何か」より明確に書くことが重要です。skills-ref validate ./my-skill でフォーマットの妥当性を検証できます。
4. Skill Bundles:ワンコマンドでワークフロー全体を起動
Skill Bundles は Hermes 2026 の強力な新機能です。Bundle は軽量 YAML ファイルで、複数の関連スキルをひとつのスラッシュコマンドにまとめます。/bundle-name 実行時、列挙されたスキルが同時に読み込まれ、個別トリガーは不要です。配置場所:~/.hermes/skill-bundles/<slug>.yaml
上級シーン例:AI リサーチャーワークフローには arxiv + deep-research + plan + excalidraw をパッケージ化;MLOps デプロイパイプラインには vllm + llama-cpp + github-pr-workflow + systematic-debugging を組み合わせます。
Bundle 優先ルール:Bundle と単一 Skill が同名の場合、Bundle が優先されます。Bundle 内の未インストール Skill はエラーにせずスキップし、欠落を通知します。Bundle はシステムプロンプトを変更しないため、Prompt Cache を壊しません(Token フレンドリー)。CLI での迅速作成:
5. 条件付き活性化(Conditional Activation):環境を賢く感知
スキルは現在のセッションで利用可能なツールに応じて、自動的に表示または非表示になります。SKILL.md の metadata.hermes 下で設定します。
| フィールド | 動作ロジック |
|---|---|
requires_toolsets | 列挙したツールセットが存在しない場合、このスキルを非表示 |
requires_tools | 列挙したツールが存在しない場合、このスキルを非表示 |
fallback_for_toolsets | 列挙したツールセットが存在する場合、このスキルを非表示(代替案として) |
fallback_for_tools | 列挙したツールが存在する場合、このスキルを非表示 |
典型シーン——無料/有料ツールの自動切替:FIRECRAWL_KEY / BRAVE_SEARCH_KEY が設定されていると、有料の web_search ツールが活性化し、DuckDuckGo スキル(fallback_for_tools: [web_search])はプロンプトから自動的に消え、Token を節約します。API が使えない場合は代替案が自動的に浮上します。hermes skills TUI では、CLI・Telegram・Discord などプラットフォームごとにスキルのオン/オフも個別設定できます。
6. Skills Hub と OSS コミュニティエコシステム
| リポジトリ | 説明 | ハイライト |
|---|---|---|
| awesome-hermes-skills | 厳選された本番向けスキル集 | Deep Research、MLOps、Apple 連携;23 スキルが GitHub Copilot と統合 |
| hermeshub | コミュニティスキル登録センター | セキュリティスキャン認証、API・マーケット機能、プロンプトインジェクション検出 |
| ai-agent-skills | 191 スキル、28 カテゴリ | Hermes/Claude Code/Cursor へのワンクリックインストール対応 |
| hermes-agent | 公式メインリポジトリ | 権威ある情報源、Skill 執筆規約を含む |
7. 独自 Skill Tap の公開:チームとコミュニティ共有
チーム展開の手順:
バージョン管理の推奨:~/.hermes/skills/ を Git で管理し、デバイス間で git pull && hermes skills reset 後に同期し、組み込みスキルを再構築します。
8. Self-Evolving Skills:GEPA + DSPy でスキルを自動進化
GEPA(Genetic-Pareto Prompt Evolution) は 2026 年 ICLR Oral 論文の成果で、Nous Research が hermes-agent-self-evolution に統合しました。核心はモデル重みを微調整せず、実行トレースの分析・変異生成・多目的パレート最適化によってスキルテキスト自体を改善することです。コストは約 $2–10/回(純粋な API 呼び出し、GPU 不要)。
GEPA 五段階進化フロー:
Stage 1 実行トレース収集(SQLite データベース、全推論トレースを読取)→ Stage 2 反省的失敗分析(LLM が「なぜ失敗したか」の actionable な洞察を生成)→ Stage 3 ターゲット変異(失敗原因に対し 10–20 個の SKILL.md 変異を生成)→ Stage 4 多目的パレート評価(成功率 × Token 効率 × 速度を同時最適化)→ Stage 5 人手 PR レビュー(最良変異が PR を生成し、承認後に本番投入)。
四大セーフガード:① 全テストスイート pytest tests/ -q が 100% パス必須;② サイズ制限 Skills ≤ 15KB、ツール説明 ≤ 500 文字;③ Prompt キャッシュ互換性;④ 意味保持チェック(スキルの本来目的から逸脱しない)。
| フェーズ | 最適化対象 | エンジン | 状態 |
|---|---|---|---|
| Phase 1 | Skill ファイル(SKILL.md) | DSPy + GEPA | ✅ 実装済み |
| Phase 2 | ツール説明 | DSPy + GEPA | 🔲 計画中 |
| Phase 3 | システムプロンプト断片 | DSPy + GEPA | 🔲 計画中 |
| Phase 4 | ツール実装コード | Darwinian Evolver | 🔲 計画中 |
| Phase 5 | 継続改善ループ(全自動) | 自動化パイプライン | 🔲 計画中 |
9. Plugin スキル:Hermes の境界を拡張
プラグインはスキルを名前空間形式(plugin:skill)でパッケージ化し、以下を実現します:デフォルトの skills_list に表示されない(システムプロンプトのノイズ削減);ユーザーが明示的に呼び出したときだけ活性化(Opt-in);プラグイン内スキル同士の相互参照。読込時に同一プラグイン内の兄弟スキルも自動表示されます。
10. スキル執筆の上級テクニック(エンジニア視点)
10.1 description が活性化精度を決める:❌「Helps with code.」→ ✅「Use when reviewing a pull request, checking for code quality issues, security vulnerabilities... Do NOT use for writing new code.」
10.2 Pitfalls が品質の分水嶺:具体的な失敗パターン、根本原因分析、実行可能な修正手順を含めるべきです(CSS セレクタの脆弱性、GitHub API レート制限、大きな diff による Token オーバーフローなど)。
10.3 スクリプト化:Procedure に Agent が scripts/extract_schema.py --input $FILE を実行すると明記し、失敗時は references/manual-extract.md を読み込むよう指示します。
10.4 スキルサイズ管理:<500 行は SKILL.md に集約;500–1000 行は references/ へ移動;>1000 行は強く分割を推奨;>15KB は GEPA 制限超過のため必ず分割します。
10.5 skill_manage で Agent が自己保守:
11. 実践ケース:技術ブログワークフロー Skills
カスタム seo-keyword-research スキル:ブログ執筆セッション開始時に、日本語ロングテール(「X 使い方」「X チュートリアル」)と英語ロングテール(「X tutorial」「how to X」「X vs Y」)をそれぞれ検索し、Zenn トレンド、Dev.to trending、HN をクロスリファレンスして、3–5 個の主キーワード + 10–15 個のロングテール語マトリクスを出力します。日英の読者が同一概念を異なる語で検索する点(「Agent」vs「エージェント」vs「代理」)にも注意が必要です。
12. 五段階ロードマップ(実装チェックリスト)
Step 1 — Hermes Agent をインストールし、公式 Skills を確認します:hermes skills install official/research/arxiv。
Step 2 — ~/.hermes/skills/ に最初の SKILL.md を作成し、description にトリガー条件を明記します。
Step 3 — よく使うワークフロー用に Bundle YAML を作成し、hermes bundles create で迅速生成します。
Step 4 — 条件付き活性化(無料/有料ツール fallback)を設定し、Token ノイズを削減します。
Step 5 — チーム共有:Tap リポジトリを作成し、hermes skills tap add github:your-org/your-skills-tap を実行;上級ユーザーは self-evolution リポジトリをクローンして GEPA 最適化を回します。
13. FAQ と引用可能な数値
Q:Skills と MCP の違いは? Skills は手続き的知識ドキュメント(Agent に「どうやるか」を教える)、MCP はツールインターフェース(Agent に追加のツール呼び出し能力を与える)です。両者は補完関係にあります。
Q:Skill を更新したのに Agent が旧版を使うのはなぜ? 現在のセッションには反映されません。/reset で新セッションを開くか、インストール時に --now を付与してください(Prompt Cache が無効化されます)。
Q:GEPA で進化したスキルは安全か? 四大セーフガード + 人手 PR レビュー;意味ドリフト検出により本来目的からの逸脱を防ぎます。
Q:Claude Code で Hermes Skills を再利用するには? SKILL.md を ~/.claude/skills/ にコピーするか、ai-agent-skills でマルチプラットフォーム一括インストールします。
Q:Skill の日本語コンテンツは Token 効率に影響するか? 日本語は約 1–1.5 token/字で英語と近いですが、description は英語のままにすると LLM のマッチ精度が高まります。
引用可能な数値:① Hermes Agent 160k+ GitHub Stars(2026 年初頭、2 か月以内)。② Level 0 全スキル合計約 ~3K Token。③ GEPA 単回最適化コスト $2–10(GPU 不要)。④ GEPA Skills サイズ制限 ≤15KB。⑤ ai-agent-skills リポジトリ 191 個のクロスプラットフォームスキル。
14. 参考資料と外部リンク
公式:Hermes Agent ドキュメント · 日本語ドキュメント · Skills システム · agentskills.io
OSS:hermes-agent-self-evolution · gepa-ai/gepa · stanfordnlp/dspy
コミュニティ:Zenn 実践ガイド · Dev.to Self-Improving Agent 解剖 · YouTube GEPA & Skill Bundles チュートリアル
15. 深度ケース:Hermes Skills + リモート Mac 7×24 進化ループ
「ある技術メディアチームがブログ執筆を blog-workflow Bundle に封じ込めました。ローカル Hermes が SEO 調査とアウトライン生成を担当(Level 0 は ~3K Token のみ)、GEPA が毎週実セッショントレースで outline-generator の Pitfalls 章を最適化——成功率は 72% から 91% に、平均 Token 消費は 18% 削減。重いスクリプト(コード検証、多言語公開)はリモート Mac ノードで SSH 実行し、ローカルのユニファイドメモリを夜間キューで占有しません。Tap リポジトリで 8 人チームが hermes skills tap add でワンクリック同期、プライベートスキルは GitHub Token で購読。」
これは当サイトの OpenRouter Hermes 用量解説、Cursor Agent Skills ガイド と補完関係にあります。Cursor Skills は IDE 内のオンデマンド読込を解決し、Hermes Skills + GEPA は「使うほど強くなる」ループを解決します。Windows/Linux でも Hermes CLI は動きますが、Xcode/FCP/ComfyUI との並行、launchd 常駐 Gateway、Metal サイドカー推論のシーンでは macOS が依然としてスムーズです。GEPA 進化や Bundle 内の重いスクリプトが長時間のテスト・バッチレンダリングを要する場合、ノート PC のユニファイドメモリは占有されやすくなります——Skill は「どうやるか」を、リモート Mac は「どこで走らせるか」を解決します。
すでに Hermes Skills でワークフローを整理しており、GEPA 評価・スクリプト・7×24 Agent に安定して借りられる Apple Silicon 算力が必要な場合は、MACGPU リモート Mac ノードの検討をおすすめします。進化評価とバッチタスクを専用ノードに任せ、ローカルには Hermes のオーケストレーションと Skill 執筆だけを残す——ユニファイドメモリは思考に、算力は夜間キューに。