Memoria dei sistemi AI — Conoscenza persistente e memoria degli agenti

Conoscenza persistente oltre una singola conversazione.

Indice

Questa sezione raccoglie guide sulla conoscenza persistente e la memoria per i sistemi AI — come gli assistenti conservano fatti, preferenze e contesto distillato tra le sessioni senza inserire ogni token in un unico prompt. Qui, per memoria si intende la ritenzione intenzionale (fatti dell’utente, riepiloghi, archivi supportati da plugin), non la RAM della GPU o i pesi del modello.

Completa il cluster più ampio dei Sistemi AI — OpenClaw, Hermes, orchestrazione — e si affianca a RAG per la meccanica del recupero e a Hosting LLM per l’esecuzione dei modelli.

La memoria si inserisce all’interno della stack dell’assistente descritta in Architettura degli Assistenti AI alongside routing, tooling e osservabilità.


Progettazione della memoria per gli assistenti

Guida trasversale ai framework per la memoria a breve termine, strutturata e di recupero — politica di consolidamento, compromessi dei vettori e pattern da OpenAI, LangGraph, Hermes e OpenClaw.


Provider di memoria per gli agenti

Backend plug-and-play esposti da framework come Hermes Agent e OpenClaw — Honcho, OpenViking, Mem0, Hindsight e altri — con diversi compromessi per LLM, embedding e database.

Per la memoria core delimitata solo per Hermes (MEMORY.md / USER.md), vedere Sistema di memoria dell’agente Hermes.


Grafi della conoscenza e Cognee

Conoscenza istituzionale e di progetto estratta in grafi per assistenti consapevoli del recupero.

I costruttori di grafi come Cognee tipicamente inglobano vault Markdown, wiki o esportazioni che le persone hanno già modificato — la salienza, la denominazione e il “perché questo era importante” sono in gran parte stabiliti prima che i chunk arrivino agli embedding. Un corpus upstream approssimativo allena l’ambiguità nell’assistente; flussi disciplinati di cattura-tramite-espressione limitano tale danno. Per questa inquadratura centrata sull’umano — incluso come differisce dal RAG focalizzato sul recupero — vedere Secondo cervello spiegato per ingegneri.


Contesto della Stack

Iscriviti

Ricevi nuovi articoli su sistemi, infrastruttura e ingegneria AI.