KI-Systeme-Speicher – Persistente Wissensspeicherung und Agentenspeicher

Persistente Wissensspeicherung über einzelne Chat-Threads hinaus.

Inhaltsverzeichnis

Dieser Abschnitt sammelt Anleitungen zu persistentem Wissen und Gedächtnis für KI-Systeme — wie Assistenten Fakten, Präferenzen und kondensierten Kontext über Sitzungen hinweg beibehalten, ohne jeden Token in einen einzigen Prompt zu stopfen. Hier bedeutet Gedächtnis die bewusste Speicherung (Nutzerfakten, Zusammenfassungen, durch Plugins gestützte Speicher), nicht GPU-RAM oder Modellgewichte.

Es ergänzt den umfassenderen KI-Systeme-Cluster — OpenClaw, Hermes, Orchestrierung — und steht neben RAG für Abrufmechaniken und LLM-Hosting für das Ausführen von Modellen.

Das Gedächtnis befindet sich innerhalb des umfassenderen Assistenten-Stacks, der in Architektur von KI-Assistenten beschrieben wird, neben Routing, Werkzeugen und Observability.


Gedächtnisdesign für Assistenten

Framework-übergreifender Leitfaden für kurzfristiges, strukturiertes und abrufbares Gedächtnis — Konsolidierungsrichtlinien, Vektor-Kompromisse und Muster von OpenAI, LangGraph, Hermes und OpenClaw.


Anbieter für Agenten-Gedächtnis

Drop-in-Backends, die von Frameworks wie Hermes Agent und OpenClaw bereitgestellt werden — Honcho, OpenViking, Mem0, Hindsight und andere — mit unterschiedlichen Kompromissen bei LLM, Embedding und Datenbank.

Für das nur auf Hermes beschränkte Kerngedächtnis (MEMORY.md / USER.md) siehe Hermes Agent Memory System.


Wissensgraphen und Cognee

Institutionelles und Projektwissen, das in Graphen extrahiert wird, um abfragebewusste Assistenten zu unterstützen.

Graph-Builder wie Cognee importieren typischerweise Markdown-Vaults, Wikis oder Exports, die bereits von Menschen bearbeitet wurden — Relevanz, Benennung und „warum das wichtig war“ sind weitgehend geklärt, bevor Chunks in Embeddings gelangen. Ein schlampiger Upstream-Korpus trainiert Mehrdeutigkeit zurück in den Assistenten; disziplinierte Capture-through-Expression-Workflows begrenzen diesen Schaden. Für diese menschenzentrierte Einbettung — einschließlich der Unterschiede zu retrieval-first RAG — siehe Second Brain für Ingenieure erklärt.


Stack-Kontext

Abonnieren

Neue Beiträge zu Systemen, Infrastruktur und KI-Engineering.