Mémoire des systèmes d’IA — Connaissance persistante et mémoire des agents

Connaissances persistantes au-delà d'une seule conversation.

Sommaire

Cette section rassemble des guides sur la connaissance persistante et la mémoire des systèmes d’IA — comment les assistants conservent les faits, les préférences et le contexte condensé entre les sessions, sans entasser chaque jeton dans une seule invite. Ici, la mémoire désigne une rétention intentionnelle (faits utilisateur, résumés, magasins soutenus par des plugins), et non la RAM du GPU ou les poids du modèle.

Elle complète le cluster plus large des Systèmes d’IA — OpenClaw, Hermes, orchestration — et se trouve à côté de RAG pour la mécanique de récupération et de L’hébergement de LLM pour l’exécution des modèles.

La mémoire s’inscrit dans la pile d’assistants plus large décrite dans Architecture des assistants IA aux côtés du routage, des outils et de l’observabilité.


Conception de la mémoire pour les assistants

Guide transversal aux cadres pour la mémoire à court terme, structurée et de récupération — politique de consolidation, compromis vectoriels et modèles issus d’OpenAI, LangGraph, Hermes et OpenClaw.


Fournisseurs de mémoire d’agent

Backends plug-and-play exposés par des cadres tels que Hermes Agent et OpenClaw — Honcho, OpenViking, Mem0, Hindsight et autres — avec différents compromis de LLM, d’incorporation et de base de données.

Pour la mémoire centrale bornée uniquement pour Hermes (MEMORY.md / USER.md), voir Système de mémoire de l’agent Hermes.


Graphes de connaissances et Cognee

Connaissances institutionnelles et de projet extraites dans des graphes pour des assistants conscients de la récupération.

Les constructeurs de graphes tels que Cognee ingèrent généralement des coffres-forts Markdown, des wikis ou des exports que les gens ont déjà edités — la saillance, la dénomination et « pourquoi cela a compté » sont largement réglées avant que les fragments n’atteignent les incorporations. Un corpus en amont négligent entraîne l’ambiguïté dans l’assistant ; les flux de travail de capture-disciplinée-par-expression limitent ces dommages. Pour cette mise en perspective centrée sur l’humain — y compris comment elle diffère du RAG centré sur la récupération —, voir Le second cerveau expliqué pour les ingénieurs.


Contexte de la pile

S'abonner

Recevez de nouveaux articles sur les systèmes, l'infrastructure et l'ingénierie IA.