2026 HERMES
SKILLS_
GEPA_
EVOLVE.
Début 2026, Nous Research publie Hermes Agent. En deux mois, le dépôt dépasse 160 000 étoiles GitHub — l'un des projets agent open source à la croissance la plus rapide. Son argument n'est pas un modèle plus grand, mais « the agent that grows with you » : un agent qui vous comprend mieux au fil du temps. Le socle technique, ce sont les Skills : une mémoire procédurale standardisée, évolutive et persistante entre les sessions. Ce guide passe directement au niveau avancé : Skills vs Memory vs Prompt, format SKILL.md et disclosure progressive en trois niveaux, Skill Bundles, activation conditionnelle, auto-évolution GEPA+DSPy, publication Tap et écosystème ouvert. En synthèse : écrivez le « comment faire » en SKILL.md portable, chargez les workflows en une commande via les Bundles, laissez GEPA affiner les skills — sans toucher aux poids du modèle. Ci-dessous : tableaux comparatifs, analyse du format, Bundles/activation conditionnelle, Taps communautaires, pipeline GEPA en cinq étapes, conseils de rédaction, cas d'usage blog, FAQ et ressources.
1. Pourquoi les Skills méritent une étude approfondie
1) Le Prompt est jetable : répéter 800 tokens de procédure de déploiement à chaque session gaspille le contexte et oublie des étapes. 2) La Memory enregistre des faits, pas des processus : savoir que vous préférez TypeScript n'enseigne pas comment ouvrir une PR selon la charte de l'équipe. 3) Les coûts en tokens dérapent : injecter tous les runbooks dans le prompt système peut consommer des dizaines de milliers de tokens dès le Level 0. 4) Aucune réutilisation cross-plateforme : chaque stack agent réinvente sa config ; les équipes ne partagent rien. Hermes Skills suit le standard ouvert agentskills.io et se porte entre Hermes, Claude Code, Cursor et OpenCode — l'infrastructure agent sur laquelle parier en 2026.
2. Concepts clés : Skills ≠ Prompts, Skills ≠ Memory
| Dimension | Prompt classique | Memory (mémoire) | Skills |
|---|---|---|---|
| Persistance | Conversation en cours | Inter-sessions, permanente | Inter-sessions, permanente |
| Moment de chargement | Toujours dans le contexte | Injection automatique à chaque session | À la demande (différence clé) |
| Coût en tokens | À chaque tour | Faible et stable | Zéro tant que non activé |
| Type de contenu | Description d'intention | Préférences / faits utilisateur | Étapes procédurales (comment faire) |
| Maintenance | Manuelle par l'utilisateur | Automatique par l'agent | Utilisateur + agent |
| Partageabilité | Peu pratique | Privée | Publiable en Tap communautaire |
Mnémotechnique : Prompt = post-it (valable ce tour) ; Memory = carnet (notes permanentes, toujours à portée) ; Skill = manuel SOP (procédure pas à pas, consulté au besoin).
3. Format SKILL.md en profondeur (standard ouvert agentskills.io)
Tous les Hermes Skills respectent la spec agentskills.io pour garantir la portabilité entre agents :
3.1 Arborescence du skill (design modulaire)
3.2 Disclosure progressive : trois niveaux de chargement
| Niveau | Contenu | Déclencheur | Coût tokens |
|---|---|---|---|
| Level 0 | name + description | Début de session, tous les skills | ~3K (tous skills confondus) |
| Level 1 | Corps complet de SKILL.md | Utilisateur /skill-name ou décision LLM | Selon longueur du fichier |
| Level 2 | Fichiers references/ scripts/ | LLM en cours d'exécution | À la demande, par fichier |
Conseil de rédaction : le champ description constitue l'intégralité du Level 0 — le LLM s'en sert pour décider de charger le skill complet. Précisez quand l'utiliser plutôt que ce que c'est. Validez avec skills-ref validate ./my-skill.
4. Skill Bundles : une commande, un workflow complet
Les Skill Bundles sont une fonctionnalité majeure de Hermes 2026. Un Bundle est un fichier YAML léger qui regroupe plusieurs skills en une seule commande slash. Exécuter /bundle-name charge tous les skills listés simultanément, sans déclenchement individuel. Emplacement : ~/.hermes/skill-bundles/<slug>.yaml
Exemples avancés : un workflow chercheur IA peut bundler arxiv + deep-research + plan + excalidraw ; un pipeline MLOps peut bundler vllm + llama-cpp + github-pr-workflow + systematic-debugging.
Règles de priorité : si un Bundle et un Skill portent le même nom, le Bundle l'emporte ; les Skills non installés dans un Bundle sont ignorés sans erreur avec un avertissement ; les Bundles ne modifient pas le prompt système, donc le cache de prompt reste valide (économie de tokens). Création rapide en CLI :
5. Activation conditionnelle : skills sensibles à l'environnement
Les skills peuvent s'afficher ou se masquer automatiquement selon la disponibilité des outils dans la session. Configuration sous metadata.hermes dans SKILL.md :
| Champ | Comportement |
|---|---|
requires_toolsets | Masquer le skill si les toolsets listés sont absents |
requires_tools | Masquer le skill si les outils listés sont absents |
fallback_for_toolsets | Masquer le skill si les toolsets listés existent (chemin de repli) |
fallback_for_tools | Masquer le skill si les outils listés existent (chemin de repli) |
Scénario classique — bascule outils gratuits/payants : lorsque FIRECRAWL_KEY / BRAVE_SEARCH_KEY sont configurés, l'outil payant web_search s'active et le skill DuckDuckGo (fallback_for_tools: [web_search]) disparaît du prompt, économisant des tokens. Si l'API est indisponible, le repli réapparaît. Via le TUI hermes skills, vous pouvez aussi activer/désactiver un skill par plateforme (CLI, Telegram, Discord).
6. Skills Hub et écosystème communautaire ouvert
| Dépôt | Description | Points forts |
|---|---|---|
| awesome-hermes-skills | Collection curatée de skills production | Deep Research, MLOps, intégration Apple ; 23 skills avec GitHub Copilot |
| hermeshub | Registre communautaire de skills | Scan sécurité, API/marketplace, détection d'injection de prompt |
| ai-agent-skills | 191 skills, 28 catégories | Installation one-click Hermes / Claude Code / Cursor |
| hermes-agent | Dépôt officiel principal | Source autoritaire avec specs de rédaction |
7. Publier votre propre Skill Tap : partage équipe et communauté
Flux de déploiement équipe :
Conseil versioning : versionnez ~/.hermes/skills/ sous Git ; entre appareils, exécutez git pull && hermes skills reset pour synchroniser et reconstruire les skills intégrés.
8. Self-Evolving Skills : GEPA + DSPy pour l'amélioration automatique
GEPA (Genetic-Pareto Prompt Evolution) est un résultat Oral ICLR 2026, intégré dans hermes-agent-self-evolution. Principe : pas de fine-tuning du modèle — analyser les traces d'exécution, générer des variantes, appliquer une optimisation Pareto multi-objectifs pour améliorer le texte du skill lui-même. Coût d'environ 2–10 $ par run (appels API uniquement, pas de GPU).
Pipeline d'évolution GEPA en cinq étapes :
Étape 1 Collecte de traces d'exécution (base SQLite, traces de raisonnement complètes) → Étape 2 Analyse réflexive des échecs (le LLM génère des informations latérales actionnables sur « pourquoi ça a échoué ») → Étape 3 Mutation ciblée (10–20 variantes SKILL.md par mode d'échec) → Étape 4 Évaluation Pareto multi-objectifs (optimiser taux de succès × efficacité tokens × vitesse) → Étape 5 Revue PR humaine (la meilleure variante ouvre une PR ; déploiement après approbation).
Quatre garde-fous de sécurité : ① La suite de tests complète pytest tests/ -q doit passer à 100 % ; ② Limites de taille Skills ≤ 15 Ko, descriptions d'outils ≤ 500 caractères ; ③ Compatibilité cache de prompt ; ④ Vérification de préservation sémantique (ne pas dériver de l'objectif original du skill).
| Phase | Cible d'optimisation | Moteur | Statut |
|---|---|---|---|
| Phase 1 | Fichiers Skill (SKILL.md) | DSPy + GEPA | ✅ Implémenté |
| Phase 2 | Descriptions d'outils | DSPy + GEPA | 🔲 Planifié |
| Phase 3 | Fragments de prompt système | DSPy + GEPA | 🔲 Planifié |
| Phase 4 | Code d'implémentation des outils | Darwinian Evolver | 🔲 Planifié |
| Phase 5 | Boucle d'amélioration continue (automatique) | Pipeline d'automatisation | 🔲 Planifié |
9. Skills Plugin : étendre les frontières de Hermes
Les plugins encapsulent les skills en espaces de noms (plugin:skill) pour qu'ils : n'apparaissent pas dans skills_list par défaut (moins de bruit dans le prompt système) ; ne s'activent que sur appel explicite (opt-in) ; puissent se référencer mutuellement au sein du plugin. Le chargement affiche automatiquement les skills frères du même plugin.
10. Conseils avancés de rédaction (regard ingénieur)
10.1 description détermine la précision d'activation : ❌ « Helps with code. » → ✅ « Use when reviewing a pull request, checking for code quality issues, security vulnerabilities... Do NOT use for writing new code. »
10.2 Pitfalls séparent le bon du excellent : incluez des modes d'échec concrets, une analyse de cause racine et des correctifs actionnables (sélecteurs CSS fragiles, rate limits API GitHub, débordement tokens sur gros diff, etc.).
10.3 Scriptez quand c'est possible : dans Procedure, précisez que l'agent exécute scripts/extract_schema.py --input $FILE ; en cas d'échec, chargez references/manual-extract.md.
10.4 Contrôle de taille : <500 lignes tout dans SKILL.md ; 500–1000 déplacez vers references/ ; >1000 envisagez fortement un découpage ; >15 Ko dépasse la limite GEPA et impose un split.
10.5 skill_manage permet à l'agent de s'auto-maintenir :
11. Cas pratique : Skills pour workflow de blog technique
Skill personnalisé seo-keyword-research : au début d'une session blog, recherchez les longues traînes chinoises (« X 怎么用 », « X 教程 ») et anglaises (« X tutorial », « how to X », « X vs Y »), croisez avec les tendances Juejin, Dev.to et HN ; produisez 3–5 mots-clés principaux plus une matrice de 10–15 longues traînes. Les audiences chinoise et anglaise ne cherchent pas un même concept de la même façon (ex. « Agent » vs « 智能体 » vs « 代理 »).
12. Checklist de mise en œuvre en cinq étapes
Étape 1 — Installez Hermes Agent et parcourez les Skills officiels : hermes skills install official/research/arxiv.
Étape 2 — Créez votre premier SKILL.md dans ~/.hermes/skills/ avec une description de déclenchement claire.
Étape 3 — Construisez des Bundle YAML pour vos workflows courants ; utilisez hermes bundles create pour un setup rapide.
Étape 4 — Configurez l'activation conditionnelle (fallback outils gratuits/payants) pour réduire le bruit de tokens.
Étape 5 — Partage équipe : créez un dépôt Tap, hermes skills tap add github:your-org/your-skills-tap ; utilisateurs avancés : clonez self-evolution et lancez l'optimisation GEPA.
13. FAQ et chiffres citables
Q : Quelle différence entre Skills et MCP ? Les Skills sont des documents de savoir procédural (enseigner à l'agent comment agir) ; MCP est une interface d'outils (donner à l'agent des appels d'outils supplémentaires). Ils se complètent.
Q : Pourquoi l'agent utilise-t-il une ancienne version du Skill après modification ? Les changements ne s'appliquent pas en cours de session ; lancez /reset pour une nouvelle session, ou installez avec --now (invalide le cache de prompt).
Q : Les skills évolués par GEPA sont-ils sûrs ? Quatre garde-fous plus revue PR humaine ; la détection de dérive sémantique préserve l'objectif original.
Q : Comment réutiliser Hermes Skills dans Claude Code ? Copiez SKILL.md vers ~/.claude/skills/, ou utilisez ai-agent-skills pour une installation multi-plateforme.
Q : Le contenu en chinois affecte-t-il l'efficacité tokens ? ~1–1,5 token par caractère chinois, proche de l'anglais ; gardez description en anglais pour un matching LLM plus précis.
Chiffres citables : ① Hermes Agent 160k+ étoiles GitHub (début 2026, en deux mois). ② Level 0 pour tous les skills confondus ~3K tokens. ③ Coût GEPA par run 2–10 $ (sans GPU). ④ Limite taille GEPA Skills ≤15 Ko. ⑤ Dépôt ai-agent-skills 191 skills cross-plateforme.
14. Lectures complémentaires et ressources
Officiel : Documentation Hermes Agent · Documentation chinoise · Système Skills · agentskills.io
Open source : hermes-agent-self-evolution · gepa-ai/gepa · stanfordnlp/dspy
Communauté : guides pratiques SegmentFault · analyses Dev.to Self-Improving Agent · tutoriels YouTube GEPA & Skill Bundles
15. Cas approfondi : Hermes Skills + boucle d'évolution Mac distant 7×24
« Une rédaction média technique a encapsulé la production de blog dans un Bundle blog-workflow : Hermes local gère la recherche SEO et la génération de plans (Level 0 ne coûte que ~3K tokens), tandis que GEPA optimise chaque semaine la section Pitfalls de outline-generator à partir de traces de session réelles — taux de succès passé de 72 % à 91 %, consommation moyenne de tokens réduite de 18 %. Les scripts lourds (validation de code, publication multilingue) tournent sur un nœud Mac distant via SSH, laissant la mémoire unifiée du MacBook libre pour Xcode et Final Cut. Un dépôt Tap permet à une équipe de 8 personnes de synchroniser en one-click via hermes skills tap add ; les skills privés s'abonnent via GitHub Token. »
Ce guide complète notre analyse d'usage OpenRouter Hermes et le guide Cursor Agent Skills : les Skills Cursor gèrent le chargement à la demande dans l'IDE ; Hermes Skills + GEPA ferment la boucle « s'améliore avec l'usage ». Windows et Linux exécutent Hermes CLI sans problème, mais macOS reste plus fluide pour paralléliser Xcode, Final Cut Pro et ComfyUI, maintenir un Gateway launchd permanent et lancer l'inférence Metal en sidecar. Quand l'évolution GEPA ou les scripts lourds d'un Bundle exigent des tests longs ou des rendus batch, la mémoire unifiée du MacBook se remplit vite — le Skill définit comment ; un Mac distant définit où.
Si vous organisez déjà vos workflows avec Hermes Skills et avez besoin d'une puissance Apple Silicon stable et locatable pour l'évaluation GEPA, les scripts et les agents 7×24, envisagez un nœud Mac distant MACGPU : évaluations d'évolution et tâches batch sur du matériel dédié ; orchestration Hermes et rédaction de Skills sur votre machine locale — mémoire unifiée pour réfléchir, compute pour les files nocturnes.