Memoria de sistemas de IA — Conocimiento persistente y memoria de agentes

Conocimiento persistente más allá de un único hilo de chat.

Índice

Esta sección recopila guías sobre conocimiento persistente y memoria para sistemas de IA: cómo los asistentes conservan hechos, preferencias y contexto destilado entre sesiones sin saturar un solo prompt con todos los tokens. Aquí, la memoria implica retención intencional (hechos del usuario, resúmenes, almacenes respaldados por complementos), no memoria RAM de GPU o pesos del modelo.

Complementa el conjunto más amplio de Sistemas de IA — OpenClaw, Hermes, orquestación — y se sitúa junto a RAG para la mecánica de recuperación y Alojamiento de LLM para la ejecución de modelos.

La memoria se encuentra dentro del stack de asistentes más amplio descrito en Arquitectura de Asistentes de IA junto con el enrutamiento, las herramientas y la observabilidad.

Diseño de memoria para asistentes

Guía transversal a marcos de trabajo para memoria a corto plazo, estructurada y de recuperación — política de consolidación, compensaciones de vectores y patrones de OpenAI, LangGraph, Hermes y OpenClaw.

Sistemas de memoria en asistentes de IA que realmente ayudan — memoria de trabajo, estado estructurado, capas de recuperación y cuándo la memoria ayuda en lugar de perjudicar

Proveedores de memoria para agentes

Backends plug-and-play expuestos por marcos de trabajo como Hermes Agent y OpenClaw — Honcho, OpenViking, Mem0, Hindsight, entre otros — con diferentes compensaciones en LLM, embeddings y bases de datos.

Comparación de proveedores de memoria para agentes — tabla completa, notas sobre dependencias y flujos de memory setup de Hermes

Para la memoria central acotada exclusiva de Hermes (MEMORY.md / USER.md), consulte Sistema de memoria del agente Hermes.

Grafos de conocimiento y Cognee

Conocimiento institucional y de proyecto extraído en grafos para asistentes conscientes de la recuperación.

Autoalojamiento de Cognee — Elección de LLM en Ollama — Inicio rápido práctico de Cognee con modelos locales
Elección del LLM adecuado para Cognee — Configuración local de Ollama — Comparación de modelos para calidad del grafo frente al hardware

Los constructores de grafos como Cognee suelen ingerir bóvedas de Markdown, wikis o exportaciones que las personas ya han editado: la relevancia, el nombramiento y el “por qué importó esto” están mayormente definidos antes de que los fragmentos lleguen a los embeddings. Un corpus de origen descuidado entrena ambigüedad en el asistente; los flujos de trabajo disciplinados de captura-hasta-expresión limitan ese daño. Para ese encuadre centrado en el humano, incluida cómo difiere del RAG centrado primero en la recuperación, consulte Segunda mente explicada para ingenieros.

Diseño de memoria para asistentes

Proveedores de memoria para agentes

Grafos de conocimiento y Cognee

Contexto del stack

Suscribirse