Geheugen van AI-systemen — persistente kennis en agentengeheugen
Persistente kennis buiten een enkele chatthread.
Deze sectie verzamelt handleidingen over duurzame kennis en geheugen voor AI-systemen — hoe assistenten feiten, voorkeuren en gedistilleerde context over sessies heen behouden zonder elk token in één prompt te proppen. Hier staat geheugen voor intentionele retentie (gebruikersgegevens, samenvattingen, door plug-ins ondersteunde opslag), niet voor GPU-ram of modelparameters.
Het vult de bredere AI-systemencluster aan — OpenClaw, Hermes, orkestratie — en staat naast RAG voor ophaalmechanica en LLM-hosting voor het draaien van modellen.
Geheugen maakt deel uit van de bredere assistentstack zoals beschreven in AI-assistentarchitectuur naast routing, tooling en observability.
Geheugenontwerp voor assistenten
Cross-framework handleiding voor kortetermijn-, gestructureerd- en ophaalgeheugen — consolidatiebeleid, vectorafwegingen en patronen van OpenAI, LangGraph, Hermes en OpenClaw.
- Geheugensystemen in AI-assistenten die echt helpen — werkgeheugen, gestructureerde staat, ophaallagen en wanneer geheugen helpt versus schaadt
Agentgeheugenaanbieders
Drop-in backends die worden blootgesteld door frameworks zoals Hermes Agent en OpenClaw — Honcho, OpenViking, Mem0, Hindsight en anderen — met verschillende LLM-, embedding- en databaseafwegingen.
- Agentgeheugenaanbieders vergeleken — volledige tabel, opmerkingen over afhankelijkheden en Hermes
memory setup-stromen
Voor alleen Hermes gebonden kerngeheugen (MEMORY.md / USER.md), zie Hermes Agentgeheugensysteem.
Kennisgrafieken en Cognee
Institutionele en projectkennis die is geëxtraheerd naar grafieken voor ophaalbewuste assistenten.
- Cognee zelf hosten — LLM kiezen op Ollama — hands-on Cognee-quickstart met lokale modellen
- De juiste LLM kiezen voor Cognee — Lokale Ollama-instelling — modelvergelijking voor grafiek kwaliteit versus hardware
Grafiekbouwers zoals Cognee consumeren typisch Markdown-vaults, wikis of exports die mensen al hebben bewerkt — relevantie, naamgeving en “waarom dit belangrijk was” zijn grotendeels opgelost voordat chunks embeddings bereiken. Een slordige upstream-corpus traint ambiguïteit terug in de assistent; gedisciplineerde workflows voor vastlegging tot expressie beperken die schade. Voor dat mensgerichte frame — inclusief hoe het verschilt van ophaal- eerste RAG — zie Second brain uitgelegd voor engineers.