AI - Page 2 - Rost Glukhov | Site personnel et blog technique

L’IA pour la gestion des connaissances : des flux de travail réels qui résistent

L’IA ne remplace pas la gestion des connaissances ; elle en modifie la forme, tant pour les individus que pour les équipes.

OpenClaw vs Agent Hermes : Étoiles, Téléchargements et Utilisations en 2026

Les frameworks d’agents IA open-source connaissent une popularité explosive sur GitHub. Deux projets au cœur de l’écosystème des systèmes IA auto-hébergés — OpenClaw et Hermes Agent — ont pris une telle avance que le reste du domaine se bat pour une lointaine troisième place.

Qwen 3.6 27B et 35B MTP par rapport au standard sur GPU 16 Go

J’ai testé les performances de la décodage spéculatif (Multi-Token Prediction, MTP) sur les modèles Qwen 3.6 27B et 35B avec une RTX 4080 dotée de 16 Go de VRAM.

Charger tous les modèles du routeur llama.cpp sans redémarrage

Mode routeur de llama.cpp est l’un des changements les plus utiles apportés à llama-server depuis des années. Il offre enfin aux opérateurs de LLM locaux une expérience de gestion des modèles proche de celle attendue d’Ollama, tout en conservant les performances brutes et le contrôle de bas niveau qui rendent llama.cpp intéressant à utiliser en premier lieu.

LLM Wiki - Savoir compilé que le RAG ne peut remplacer

Le principe est simple : les connaissances compilées sont plus réutilisables que les fragments récupérés. RAG est devenu la réponse par défaut à une question simple : comment donner à un LLM (modèle de langage) l’accès à des connaissances externes ?

PKM, RAG, Wiki et systèmes de mémoire expliqués clairement

La gestion des connaissances personnelles (PKM), la génération augmentée par la récupération (RAG), les wikis, les systèmes de mémoire IA et désormais les flux de travail assistés par IA pratiques sont souvent discutés comme s’ils résoudaient le même problème. Ce n’est pas le cas. Ils traitent tous de la connaissance, mais ils opèrent à différents niveaux :

Validation des sorties structurées des LLM en Python qui tient la route

La plupart des tutoriels sur les « sorties structurées » des LLM manquent de sérieux. Ils vous apprennent à demander du JSON poliment, puis à espérer que le modèle se comporte correctement. Ce n’est pas de la validation. C’est de l’optimisme entre accolades.

Référence des paramètres d'inférence des LLMs agissants pour Qwen et Gemma

Cette page est une référence pratique pour l’optimisation de l’inférence des LLMs agents (température, top_p, top_k, pénalités, et comment ils interagissent dans les flux de travail multi-étapes et intensifs en outils).

Contrôle vocal d'Hermes depuis votre téléphone

Vous discutez déjà avec l’agent Hermes depuis votre téléphone par messages texte. Vous souhaitez désormais lui parler directement et recevoir des réponses vocales. C’est généralement la bonne approche, surtout si vous utilisez déjà Hermes comme assistant auto-hébergé persistant. Taper de longs prompts sur un petit écran est lent et sujet aux erreurs.

Kanban dans Hermes Agent pour les flux de travail d'LLM auto-hébergés

Hermes Agent est livré avec un tableau Kanban et la passerelle Hermes qui peuvent saturer votre LLM auto-hébergé si trop de tâches sont expédiées simultanément.

Création de compétences pour l'agent Hermes — Structure de SKILL.md et bonnes pratiques

Hermes Agent considère les compétences (skills) comme la méthode par défaut pour enseigner des flux de travail répétables. La documentation officielle les décrit comme des documents de connaissances sur demande, alignés sur le format ouvert agentskills.io, chargés via une révélation progressive afin que le modèle voie d’abord un index réduit et n’extraye les instructions complètes que lorsqu’une tâche en a réellement besoin.

Guide de référence Hermes Agent CLI — commandes, drapeaux et raccourcis slash

L’agent Hermes de Nous Research est un assistant agnostique du modèle et utilisant des outils que vous exécutez localement ou sur un VPS.

Guide pratique NemoClaw pour des opérations OpenClaw sécurisées en 2026

La plupart des stacks d’agents IA considèrent encore la sécurité comme une correction à appliquer après la démonstration. NemoClaw part du principe inverse et fait de l’isolation, des politiques et du routage des valeurs par défaut dès le premier jour.

Comparaison des fournisseurs de mémoire pour agents — Honcho, Mem0, Hindsight et cinq autres

Les assistants modernes oublient toujours tout lorsque vous fermez l’onglet, à moins qu’un élément ne persiste au-delà de la fenêtre de contexte. Les fournisseurs de mémoire d’agent sont des services ou des bibliothèques qui conservent des faits et des résumés entre les sessions — souvent intégrés en tant que plugins afin que le cadre reste léger tandis que la mémoire évolue.

Mémoire des systèmes d’IA — Connaissance persistante et mémoire des agents

Cette section rassemble des guides sur la connaissance persistante et la mémoire des systèmes d’IA — comment les assistants conservent les faits, les préférences et le contexte condensé entre les sessions, sans entasser chaque jeton dans une seule invite. Ici, la mémoire désigne une rétention intentionnelle (faits utilisateur, résumés, magasins soutenus par des plugins), et non la RAM du GPU ou les poids du modèle.

Système de mémoire des agents Hermes : comment fonctionne réellement la mémoire persistante de l'IA

Vous connaissez la routine. Vous ouvrez une conversation avec un agent IA, vous lui expliquez votre projet, partagez vos préférences, obtenez des résultats, puis fermez l’onglet. La semaine suivante, en revenant, c’est comme parler à un étranger : tout le contexte a disparu, chaque préférence a été oubliée, le projet doit être réexpliqué à partir de zéro.