KI-Systeme-Speicher – Persistente Wissensspeicherung und Agentenspeicher
Persistente Wissensspeicherung über einzelne Chat-Threads hinaus.
Dieser Abschnitt sammelt Anleitungen zu persistentem Wissen und Gedächtnis für KI-Systeme — wie Assistenten Fakten, Präferenzen und kondensierten Kontext über Sitzungen hinweg beibehalten, ohne jeden Token in einen einzigen Prompt zu stopfen. Hier bedeutet Gedächtnis die bewusste Speicherung (Nutzerfakten, Zusammenfassungen, durch Plugins gestützte Speicher), nicht GPU-RAM oder Modellgewichte.
Es ergänzt den umfassenderen KI-Systeme-Cluster — OpenClaw, Hermes, Orchestrierung — und steht neben RAG für Abrufmechaniken und LLM-Hosting für das Ausführen von Modellen.
Das Gedächtnis befindet sich innerhalb des umfassenderen Assistenten-Stacks, der in Architektur von KI-Assistenten beschrieben wird, neben Routing, Werkzeugen und Observability.
Gedächtnisdesign für Assistenten
Framework-übergreifender Leitfaden für kurzfristiges, strukturiertes und abrufbares Gedächtnis — Konsolidierungsrichtlinien, Vektor-Kompromisse und Muster von OpenAI, LangGraph, Hermes und OpenClaw.
- Gedächtnissysteme in KI-Assistenten, die tatsächlich helfen — Arbeitsgedächtnis, strukturierter Zustand, Abrufschichten und wann Gedächtnis hilft versus schadet
Anbieter für Agenten-Gedächtnis
Drop-in-Backends, die von Frameworks wie Hermes Agent und OpenClaw bereitgestellt werden — Honcho, OpenViking, Mem0, Hindsight und andere — mit unterschiedlichen Kompromissen bei LLM, Embedding und Datenbank.
- Vergleich von Agenten-Gedächtnisanbietern — Vollständige Tabelle, Hinweise zu Abhängigkeiten und Hermes
memory setup-Workflows
Für das nur auf Hermes beschränkte Kerngedächtnis (MEMORY.md / USER.md) siehe Hermes Agent Memory System.
Wissensgraphen und Cognee
Institutionelles und Projektwissen, das in Graphen extrahiert wird, um abfragebewusste Assistenten zu unterstützen.
- Cognee selbst hosten — LLM-Auswahl auf Ollama — Praktischer Cognee-Quickstart mit lokalen Modellen
- Die richtige LLM für Cognee wählen — Lokales Ollama-Setup — Modellvergleich für Graphqualität versus Hardware
Graph-Builder wie Cognee importieren typischerweise Markdown-Vaults, Wikis oder Exports, die bereits von Menschen bearbeitet wurden — Relevanz, Benennung und „warum das wichtig war“ sind weitgehend geklärt, bevor Chunks in Embeddings gelangen. Ein schlampiger Upstream-Korpus trainiert Mehrdeutigkeit zurück in den Assistenten; disziplinierte Capture-through-Expression-Workflows begrenzen diesen Schaden. Für diese menschenzentrierte Einbettung — einschließlich der Unterschiede zu retrieval-first RAG — siehe Second Brain für Ingenieure erklärt.