Geheugen van AI-systemen — persistente kennis en agentengeheugen

Persistente kennis buiten een enkele chatthread.

Inhoud

Deze sectie verzamelt handleidingen over duurzame kennis en geheugen voor AI-systemen — hoe assistenten feiten, voorkeuren en gedistilleerde context over sessies heen behouden zonder elk token in één prompt te proppen. Hier staat geheugen voor intentionele retentie (gebruikersgegevens, samenvattingen, door plug-ins ondersteunde opslag), niet voor GPU-ram of modelparameters.

Het vult de bredere AI-systemencluster aan — OpenClaw, Hermes, orkestratie — en staat naast RAG voor ophaalmechanica en LLM-hosting voor het draaien van modellen.

Geheugen maakt deel uit van de bredere assistentstack zoals beschreven in AI-assistentarchitectuur naast routing, tooling en observability.

Geheugenontwerp voor assistenten

Cross-framework handleiding voor kortetermijn-, gestructureerd- en ophaalgeheugen — consolidatiebeleid, vectorafwegingen en patronen van OpenAI, LangGraph, Hermes en OpenClaw.

Geheugensystemen in AI-assistenten die echt helpen — werkgeheugen, gestructureerde staat, ophaallagen en wanneer geheugen helpt versus schaadt

Agentgeheugenaanbieders

Drop-in backends die worden blootgesteld door frameworks zoals Hermes Agent en OpenClaw — Honcho, OpenViking, Mem0, Hindsight en anderen — met verschillende LLM-, embedding- en databaseafwegingen.

Agentgeheugenaanbieders vergeleken — volledige tabel, opmerkingen over afhankelijkheden en Hermes memory setup-stromen

Voor alleen Hermes gebonden kerngeheugen (MEMORY.md / USER.md), zie Hermes Agentgeheugensysteem.

Kennisgrafieken en Cognee

Institutionele en projectkennis die is geëxtraheerd naar grafieken voor ophaalbewuste assistenten.

Cognee zelf hosten — LLM kiezen op Ollama — hands-on Cognee-quickstart met lokale modellen
De juiste LLM kiezen voor Cognee — Lokale Ollama-instelling — modelvergelijking voor grafiek kwaliteit versus hardware

Grafiekbouwers zoals Cognee consumeren typisch Markdown-vaults, wikis of exports die mensen al hebben bewerkt — relevantie, naamgeving en “waarom dit belangrijk was” zijn grotendeels opgelost voordat chunks embeddings bereiken. Een slordige upstream-corpus traint ambiguïteit terug in de assistent; gedisciplineerde workflows voor vastlegging tot expressie beperken die schade. Voor dat mensgerichte frame — inclusief hoe het verschilt van ophaal- eerste RAG — zie Second brain uitgelegd voor engineers.

Geheugenontwerp voor assistenten

Agentgeheugenaanbieders

Kennisgrafieken en Cognee

Stackscontext

Abonneren