Mémoire des systèmes d’IA — Connaissance persistante et mémoire des agents
Connaissances persistantes au-delà d'une seule conversation.
Cette section rassemble des guides sur la connaissance persistante et la mémoire des systèmes d’IA — comment les assistants conservent les faits, les préférences et le contexte condensé entre les sessions, sans entasser chaque jeton dans une seule invite. Ici, la mémoire désigne une rétention intentionnelle (faits utilisateur, résumés, magasins soutenus par des plugins), et non la RAM du GPU ou les poids du modèle.
Elle complète le cluster plus large des Systèmes d’IA — OpenClaw, Hermes, orchestration — et se trouve à côté de RAG pour la mécanique de récupération et de L’hébergement de LLM pour l’exécution des modèles.
La mémoire s’inscrit dans la pile d’assistants plus large décrite dans Architecture des assistants IA aux côtés du routage, des outils et de l’observabilité.
Conception de la mémoire pour les assistants
Guide transversal aux cadres pour la mémoire à court terme, structurée et de récupération — politique de consolidation, compromis vectoriels et modèles issus d’OpenAI, LangGraph, Hermes et OpenClaw.
- Systèmes de mémoire dans les assistants IA qui sont réellement utiles — mémoire de travail, état structuré, couches de récupération et quand la mémoire aide ou nuit
Fournisseurs de mémoire d’agent
Backends plug-and-play exposés par des cadres tels que Hermes Agent et OpenClaw — Honcho, OpenViking, Mem0, Hindsight et autres — avec différents compromis de LLM, d’incorporation et de base de données.
- Comparaison des fournisseurs de mémoire d’agent — tableau complet, notes sur les dépendances et flux
memory setupde Hermes
Pour la mémoire centrale bornée uniquement pour Hermes (MEMORY.md / USER.md), voir Système de mémoire de l’agent Hermes.
Graphes de connaissances et Cognee
Connaissances institutionnelles et de projet extraites dans des graphes pour des assistants conscients de la récupération.
- Auto-hébergement de Cognee — Choix du LLM sur Ollama — démarrage rapide pratique de Cognee avec des modèles locaux
- Choisir le bon LLM pour Cognee — Configuration locale Ollama — comparaison de modèles pour la qualité du graphe par rapport au matériel
Les constructeurs de graphes tels que Cognee ingèrent généralement des coffres-forts Markdown, des wikis ou des exports que les gens ont déjà edités — la saillance, la dénomination et « pourquoi cela a compté » sont largement réglées avant que les fragments n’atteignent les incorporations. Un corpus en amont négligent entraîne l’ambiguïté dans l’assistant ; les flux de travail de capture-disciplinée-par-expression limitent ces dommages. Pour cette mise en perspective centrée sur l’humain — y compris comment elle diffère du RAG centré sur la récupération —, voir Le second cerveau expliqué pour les ingénieurs.