Memoria de sistemas de IA — Conocimiento persistente y memoria de agentes
Conocimiento persistente más allá de un único hilo de chat.
Esta sección recopila guías sobre conocimiento persistente y memoria para sistemas de IA: cómo los asistentes conservan hechos, preferencias y contexto destilado entre sesiones sin saturar un solo prompt con todos los tokens. Aquí, la memoria implica retención intencional (hechos del usuario, resúmenes, almacenes respaldados por complementos), no memoria RAM de GPU o pesos del modelo.
Complementa el conjunto más amplio de Sistemas de IA — OpenClaw, Hermes, orquestación — y se sitúa junto a RAG para la mecánica de recuperación y Alojamiento de LLM para la ejecución de modelos.
La memoria se encuentra dentro del stack de asistentes más amplio descrito en Arquitectura de Asistentes de IA junto con el enrutamiento, las herramientas y la observabilidad.
Diseño de memoria para asistentes
Guía transversal a marcos de trabajo para memoria a corto plazo, estructurada y de recuperación — política de consolidación, compensaciones de vectores y patrones de OpenAI, LangGraph, Hermes y OpenClaw.
- Sistemas de memoria en asistentes de IA que realmente ayudan — memoria de trabajo, estado estructurado, capas de recuperación y cuándo la memoria ayuda en lugar de perjudicar
Proveedores de memoria para agentes
Backends plug-and-play expuestos por marcos de trabajo como Hermes Agent y OpenClaw — Honcho, OpenViking, Mem0, Hindsight, entre otros — con diferentes compensaciones en LLM, embeddings y bases de datos.
- Comparación de proveedores de memoria para agentes — tabla completa, notas sobre dependencias y flujos de
memory setupde Hermes
Para la memoria central acotada exclusiva de Hermes (MEMORY.md / USER.md), consulte Sistema de memoria del agente Hermes.
Grafos de conocimiento y Cognee
Conocimiento institucional y de proyecto extraído en grafos para asistentes conscientes de la recuperación.
- Autoalojamiento de Cognee — Elección de LLM en Ollama — Inicio rápido práctico de Cognee con modelos locales
- Elección del LLM adecuado para Cognee — Configuración local de Ollama — Comparación de modelos para calidad del grafo frente al hardware
Los constructores de grafos como Cognee suelen ingerir bóvedas de Markdown, wikis o exportaciones que las personas ya han editado: la relevancia, el nombramiento y el “por qué importó esto” están mayormente definidos antes de que los fragmentos lleguen a los embeddings. Un corpus de origen descuidado entrena ambigüedad en el asistente; los flujos de trabajo disciplinados de captura-hasta-expresión limitan ese daño. Para ese encuadre centrado en el humano, incluida cómo difiere del RAG centrado primero en la recuperación, consulte Segunda mente explicada para ingenieros.