Memoria de sistemas de IA — Conocimiento persistente y memoria de agentes

Conocimiento persistente más allá de un único hilo de chat.

Índice

Esta sección recopila guías sobre conocimiento persistente y memoria para sistemas de IA: cómo los asistentes conservan hechos, preferencias y contexto destilado entre sesiones sin saturar un solo prompt con todos los tokens. Aquí, la memoria implica retención intencional (hechos del usuario, resúmenes, almacenes respaldados por complementos), no memoria RAM de GPU o pesos del modelo.

Complementa el conjunto más amplio de Sistemas de IA — OpenClaw, Hermes, orquestación — y se sitúa junto a RAG para la mecánica de recuperación y Alojamiento de LLM para la ejecución de modelos.

La memoria se encuentra dentro del stack de asistentes más amplio descrito en Arquitectura de Asistentes de IA junto con el enrutamiento, las herramientas y la observabilidad.


Diseño de memoria para asistentes

Guía transversal a marcos de trabajo para memoria a corto plazo, estructurada y de recuperación — política de consolidación, compensaciones de vectores y patrones de OpenAI, LangGraph, Hermes y OpenClaw.


Proveedores de memoria para agentes

Backends plug-and-play expuestos por marcos de trabajo como Hermes Agent y OpenClaw — Honcho, OpenViking, Mem0, Hindsight, entre otros — con diferentes compensaciones en LLM, embeddings y bases de datos.

Para la memoria central acotada exclusiva de Hermes (MEMORY.md / USER.md), consulte Sistema de memoria del agente Hermes.


Grafos de conocimiento y Cognee

Conocimiento institucional y de proyecto extraído en grafos para asistentes conscientes de la recuperación.

Los constructores de grafos como Cognee suelen ingerir bóvedas de Markdown, wikis o exportaciones que las personas ya han editado: la relevancia, el nombramiento y el “por qué importó esto” están mayormente definidos antes de que los fragmentos lleguen a los embeddings. Un corpus de origen descuidado entrena ambigüedad en el asistente; los flujos de trabajo disciplinados de captura-hasta-expresión limitan ese daño. Para ese encuadre centrado en el humano, incluida cómo difiere del RAG centrado primero en la recuperación, consulte Segunda mente explicada para ingenieros.


Contexto del stack

Suscribirse

Recibe nuevas publicaciones sobre sistemas, infraestructura e ingeniería de IA.