Memoria dei sistemi AI — Conoscenza persistente e memoria degli agenti
Conoscenza persistente oltre una singola conversazione.
Questa sezione raccoglie guide sulla conoscenza persistente e la memoria per i sistemi AI — come gli assistenti conservano fatti, preferenze e contesto distillato tra le sessioni senza inserire ogni token in un unico prompt. Qui, per memoria si intende la ritenzione intenzionale (fatti dell’utente, riepiloghi, archivi supportati da plugin), non la RAM della GPU o i pesi del modello.
Completa il cluster più ampio dei Sistemi AI — OpenClaw, Hermes, orchestrazione — e si affianca a RAG per la meccanica del recupero e a Hosting LLM per l’esecuzione dei modelli.
La memoria si inserisce all’interno della stack dell’assistente descritta in Architettura degli Assistenti AI alongside routing, tooling e osservabilità.
Progettazione della memoria per gli assistenti
Guida trasversale ai framework per la memoria a breve termine, strutturata e di recupero — politica di consolidamento, compromessi dei vettori e pattern da OpenAI, LangGraph, Hermes e OpenClaw.
- Sistemi di memoria negli assistenti AI che funzionano davvero — memoria di lavoro, stato strutturato, livelli di recupero e quando la memoria aiuta o danneggia
Provider di memoria per gli agenti
Backend plug-and-play esposti da framework come Hermes Agent e OpenClaw — Honcho, OpenViking, Mem0, Hindsight e altri — con diversi compromessi per LLM, embedding e database.
- Confronto tra provider di memoria per agenti — tabella completa, note sulle dipendenze e flussi di
memory setupper Hermes
Per la memoria core delimitata solo per Hermes (MEMORY.md / USER.md), vedere Sistema di memoria dell’agente Hermes.
Grafi della conoscenza e Cognee
Conoscenza istituzionale e di progetto estratta in grafi per assistenti consapevoli del recupero.
- Self-Hosting di Cognee — Scelta dell’LLM su Ollama — avvio pratico di Cognee con modelli locali
- Scelta dell’LLM giusto per Cognee — Configurazione locale Ollama — confronto dei modelli per qualità del grafo vs hardware
I costruttori di grafi come Cognee tipicamente inglobano vault Markdown, wiki o esportazioni che le persone hanno già modificato — la salienza, la denominazione e il “perché questo era importante” sono in gran parte stabiliti prima che i chunk arrivino agli embedding. Un corpus upstream approssimativo allena l’ambiguità nell’assistente; flussi disciplinati di cattura-tramite-espressione limitano tale danno. Per questa inquadratura centrata sull’umano — incluso come differisce dal RAG focalizzato sul recupero — vedere Secondo cervello spiegato per ingegneri.