Proveedores de memoria para agentes comparados: Honcho, Mem0, Hindsight y cinco más
Ocho backends enchufables para la memoria persistente del agente.
Los asistentes modernos aún olvidan todo cuando cierras la pestaña, a menos que algo persista más allá de la ventana de contexto. Los proveedores de memoria de agentes son servicios o bibliotecas que retienen hechos y resúmenes a través de las sesiones; a menudo se integran como complementos para que el marco de trabajo permanezca ligero mientras la memoria escala.
Esta guía compara ocho backends que se distribuyen como complementos de memoria externa de Hermes Agent: Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover y Supermemory, y explica cómo encajan en las pileras de sistemas de IA más amplias. Los mismos proveedores aparecen en OpenClaw y otras herramientas de agentes mediante integraciones de la comunidad o oficiales. El centro de memoria de sistemas de IA enumera este artículo junto con Cognee y guías relacionadas.
Para información sobre la memoria central acotada específica de Hermes (MEMORY.md y USER.md), el comportamiento de congelación y los desencadenantes, consulta el Sistema de memoria de Hermes Agent. Para contexto sobre cómo los ocho proveedores de memoria nativos de Hermes contribuyen a su ventaja de adopción creciente frente a OpenClaw, incluidas las estrellas de GitHub, los rankings de tokens de OpenRouter y comparaciones del tamaño del ecosistema, consulta OpenClaw vs Hermes Agent: Estrellas, descargas y uso 2026.
Hermes Agent enumera ocho complementos de proveedores de memoria externa para conocimiento persistente y transversal a las sesiones. Solo un proveedor externo puede estar activo a la vez. Los archivos MEMORY.md y USER.md integrados permanecen cargados junto con él; son aditivos, no de reemplazo.
Dependencias externas. Todos los proveedores externos, excepto Holographic, requieren al menos una llamada a un servicio externo: un LLM para la extracción de memoria, un modelo de incrustación para búsqueda semántica o una base de datos como PostgreSQL para el almacenamiento. Estas dependencias tienen implicaciones directas para la privacidad, el costo y si tu pila de memoria puede ejecutarse completamente autoalojada. Hindsight y ByteRover agrupan o eliminan la mayoría de las dependencias; Honcho, Mem0 y Supermemory requieren más componentes móviles. Donde un proveedor admite Ollama o cualquier punto final compatible con OpenAI, puedes enrutar las llamadas de LLM e incrustaciones a un modelo local y mantener los datos fuera de servidores de terceros por completo.

Activación con Hermes Agent
Los pasos de línea de comandos a continuación reflejan las tablas de la hoja de trucos de la CLI de Hermes Agent.
hermes memory setup # Selector interactivo + configuración
hermes memory status # Verificar qué está activo
hermes memory off # Desactivar proveedor externo
O manualmente en ~/.hermes/config.yaml:
memory:
provider: openviking # o honcho, mem0, hindsight, holographic, retaindb, byterover, supermemory
Comparación de proveedores
| Proveedor | Almacenamiento | Costo | Dependencias externas | Autoalojable | Característica única |
|---|---|---|---|---|---|
| Honcho | Nube/Autoalojado | Pago/Gratis | LLM + Modelo de incrustación + PostgreSQL/pgvector + Redis | Sí — Docker / K3s / Fly.io | Modelado de usuario dialéctico + contexto de ámbito de sesión |
| OpenViking | Autoalojado | Gratis | LLM (VLM) + Modelo de incrustación | Sí — servidor local; asistente de inicio nativo de Ollama | Jerarquía de sistema de archivos + carga escalonada |
| Mem0 | Nube/Autoalojado | Pago/Gratis OSS | LLM + Modelo de incrustación + Almacén vectorial (Qdrant o pgvector) | Sí — Docker Compose OSS; totalmente local posible | Extracción de LLM del lado del servidor |
| Hindsight | Nube/Local | Gratis/Pago | LLM + PostgreSQL incluido + incrustador integrado + rerank integrado | Sí — Docker o Python incrustado; totalmente local con Ollama | Grafo de conocimiento + síntesis reflect |
| Holographic | Local | Gratis | Ninguna | Nativo — no requiere infraestructura | Álgebra HRR + puntuación de confianza |
| RetainDB | Nube | $20/mes | Gestionado en la nube (LLM + recuperación en servidores de RetainDB) | No | Compresión delta |
| ByteRover | Local/Nube | Gratis/Pago | Solo LLM — sin modelo de incrustación, sin base de datos | Sí — local primero por defecto; Ollama soportado | Árbol de contexto basado en archivos; sin pipeline de incrustación |
| Supermemory | Nube | Pago | LLM + PostgreSQL/pgvector (despliegue empresarial de Cloudflare) | Solo plan empresarial | Cierre de contexto + ingestión de grafo de sesión |
Desglose detallado
Honcho
Ideal para: sistemas multiagente, contexto transversal a sesiones, alineación usuario-agente.
Honcho funciona junto con la memoria existente: USER.md permanece igual, y Honcho añade una capa adicional de contexto. Modela las conversaciones como pares que intercambian mensajes: un par de usuario más un par de IA por perfil de Hermes, todos compartiendo un espacio de trabajo.
Dependencias externas: Honcho requiere un LLM para la resumen de sesión, derivación de representación de usuario y razonamiento dialéctico; un modelo de incrustación para búsqueda semántica a través de observaciones; PostgreSQL con la extensión pgvector para almacenamiento vectorial; y Redis para caché. La nube gestionada en api.honcho.dev se encarga de todo esto por ti. Para despliegues autoalojados (Docker, K3s o Fly.io), debes proporcionar tus propias credenciales. El slot de LLM acepta cualquier punto final compatible con OpenAI, incluidos Ollama y vLLM, por lo que la inferencia puede permanecer en las instalaciones. El slot de incrustación predeterminado es openai/text-embedding-3-small, pero admite proveedores configurables mediante LLM_EMBEDDING_API_KEY y LLM_EMBEDDING_BASE_URL; cualquier servidor de incrustación compatible con OpenAI funciona, incluidas las opciones locales como vLLM con un modelo BGE.
Herramientas: honcho_profile (leer/actualizar tarjeta de par), honcho_search (búsqueda semántica), honcho_context (contexto de sesión: resumen, representación, tarjeta, mensajes), honcho_reasoning (sintetizado por LLM), honcho_conclude (crear/eliminar conclusiones).
Controles de configuración clave:
contextCadence(predeterminado 1): Mínimo de turnos entre actualizaciones de la capa basedialecticCadence(predeterminado 2): Mínimo de turnos entre llamadas LLM depeer.chat()(se recomienda 1-5)dialecticDepth(predeterminado 1): Pasos.chat()por invocación (limitado a 1-3)recallMode(predeterminado ‘hybrid’):hybrid(automático+herramientas),context(solo inyección),tools(solo herramientas)writeFrequency(predeterminado ‘async’): Timing de vaciado:async,turn,sessiono entero NobservationMode(predeterminado ‘directional’):directional(todo activado) ounified(pooled compartido)
Arquitectura: Inyección de contexto de dos capas: capa base (resumen de sesión + representación + tarjeta de par) + suplemento dialéctico (razonamiento LLM). Selecciona automáticamente prompts de inicio en frío vs. caliente.
Mapeo multi-par: El espacio de trabajo es un entorno compartido entre perfiles. El par de usuario (peerName) es una identidad humana global. El par de IA (aiPeer) es uno por perfil de Hermes (hermes predeterminado, hermes.<perfil> para otros).
Configuración:
hermes memory setup # seleccionar "honcho"
# o legacy: hermes honcho setup
Config: $HERMES_HOME/honcho.json (local al perfil) o ~/.honcho/config.json (global).
Gestión de perfiles:
hermes profile create coder --clone # Crea hermes.coder con espacio de trabajo compartido
hermes honcho sync # Rellena pares de IA para perfiles existentes
OpenViking
Ideal para: gestión de conocimiento autoalojada con navegación estructurada.
OpenViking proporciona una jerarquía de sistema de archivos con carga escalonada. Es gratis, autoalojada y te da control total sobre tu almacenamiento de memoria.
Dependencias externas: OpenViking requiere un VLM (modelo de visión-idioma) para procesamiento semántico y extracción de memoria, y un modelo de incrustación para búsqueda vectorial; ambos son obligatorios. Los proveedores de VLM soportados incluyen OpenAI, Anthropic, DeepSeek, Gemini, Moonshot y vLLM (para despliegue local). Para incrustaciones, los proveedores soportados incluyen OpenAI, Volcengine (Doubao), Jina, Voyage y, mediante Ollama, cualquier modelo de incrustación servido localmente. El asistente interactivo openviking-server init puede detectar la RAM disponible y recomendar modelos de Ollama adecuados (p. ej., Qwen3-Embedding 8B para incrustaciones, Gemma 4 27B para VLM) y configurar todo automáticamente para una configuración totalmente local y sin claves API. No se requiere base de datos externa; OpenViking almacena la memoria en el sistema de archivos.
Herramientas: viking_search, viking_read (escalones), viking_browse, viking_remember, viking_add_resource.
Configuración:
pip install openviking
openviking-server init # asistente interactivo (recomienda modelos de Ollama para configuración local)
openviking-server
hermes memory setup # seleccionar "openviking"
echo "OPENVIKING_ENDPOINT=http://localhost:1933" >> ~/.hermes/.env
Mem0
Ideal para: gestión de memoria sin intervención con extracción automática.
Mem0 maneja la extracción de memoria del lado del servidor mediante una llamada LLM en cada operación add: lee la conversación, extrae hechos discretos, elimina duplicados y los almacena. La API de nube gestionada se encarga de toda la infraestructura. La biblioteca de código abierto y el servidor autoalojado te dan control total.
Dependencias externas: Mem0 requiere un LLM para la extracción de memoria (predeterminado: OpenAI gpt-4.1-nano; se soportan 20 proveedores, incluidos Ollama, vLLM y LM Studio para modelos locales) y un modelo de incrustación para recuperación (predeterminado: OpenAI text-embedding-3-small; se soportan 10 proveedores, incluidos Ollama y HuggingFace para modelos locales). El almacenamiento usa Qdrant en /tmp/qdrant en modo biblioteca, o PostgreSQL con pgvector en modo servidor autoalojado; ambos pueden ejecutarse localmente. Una pila Mem0 totalmente local y sin nube es achievable: Ollama para LLM, Ollama para incrustaciones y una instancia local de Qdrant, todo configurado mediante Memory.from_config.
Herramientas: mem0_profile, mem0_search, mem0_conclude.
Configuración:
pip install mem0ai
hermes memory setup # seleccionar "mem0"
echo "MEM0_API_KEY=your-key" >> ~/.hermes/.env
Config: $HERMES_HOME/mem0.json (user_id: hermes-user, agent_id: hermes).
Hindsight
Ideal para: recuperación basada en grafos de conocimiento con relaciones de entidades.
Hindsight construye un grafo de conocimiento de tu memoria, extrayendo entidades y relaciones. Su herramienta única reflect realiza síntesis transversal a la memoria: combina múltiples memorias en nuevos conocimientos. La recuperación ejecuta cuatro estrategias en paralelo (semántica, palabra clave/BM25, recorrido de grafo, temporal) y luego fusiona y reordena los resultados usando fusión de rango recíproco.
Dependencias externas: Hindsight requiere un LLM para la extracción de hechos y entidades en llamadas retain, y para síntesis en llamadas reflect (predeterminado: OpenAI; proveedores soportados incluyen Anthropic, Gemini, Groq, Ollama, LM Studio y cualquier punto final compatible con OpenAI). El modelo de incrustación y el modelo reranker de codificador cruzado están incluidos dentro del propio Hindsight: se ejecutan localmente dentro del paquete hindsight-all y no requieren API externa. PostgreSQL también está incluido con la instalación de Python incrustado mediante un directorio de datos pg0 gestionado; alternativamente, puedes apuntar Hindsight a una instancia externa de PostgreSQL. Para una configuración totalmente local y sin nube, establece HINDSIGHT_API_LLM_PROVIDER=ollama y apúntalo a un modelo local de Ollama: retain y recall funcionan completamente; reflect requiere un modelo capaz de llamadas de herramientas (p. ej., qwen3:8b).
Herramientas: hindsight_retain, hindsight_recall, hindsight_reflect (síntesis transversal única).
Configuración:
hermes memory setup # seleccionar "hindsight"
echo "HINDSIGHT_API_KEY=your-key" >> ~/.hermes/.env
Instala automáticamente hindsight-client (nube) o hindsight-all (local). Requiere >= 0.4.22.
Config: $HERMES_HOME/hindsight/config.json
mode:cloudolocalrecall_budget:low/mid/highmemory_mode:hybrid/context/toolsauto_retain/auto_recall:true(predeterminado)
Interfaz de usuario local: hindsight-embed -p hermes ui start
Holographic
Ideal para: configuraciones centradas en la privacidad con almacenamiento solo local.
Holographic usa álgebra HRR (Representación Reducida Holográfica) para la codificación de memoria, con puntuación de confianza para la fiabilidad de la memoria. Sin dependencia de la nube: todo se ejecuta localmente en tu propio hardware.
Dependencias externas: Ninguna. Holographic no requiere LLM, modelo de incrustación, base de datos ni conexión de red. La codificación de memoria se realiza completamente a través del álgebra HRR ejecutándose en el proceso. Esto lo hace único entre los ocho proveedores: es el único que opera con cero llamadas externas. La compensación es que la calidad de recuperación es menor que la búsqueda semántica basada en incrustaciones, y no hay síntesis transversal a la memoria como el reflect de Hindsight. Para usuarios donde la privacidad y la operación sin dependencias son innegociables, Holographic es la única opción que ofrece eso incondicionalmente.
Herramientas: 2 herramientas para operaciones de memoria mediante álgebra HRR.
Configuración:
hermes memory setup # seleccionar "holographic"
RetainDB
Ideal para: actualizaciones de alta frecuencia con compresión delta.
RetainDB usa compresión delta para almacenar eficientemente las actualizaciones de memoria y recuperación híbrida (vectorial + BM25 + reranking) para mostrar contexto relevante. Es basado en la nube con un costo de $20/mes, con todo el procesamiento de memoria manejado del lado del servidor.
Dependencias externas: Las llamadas LLM, el pipeline de incrustación y el reranking de RetainDB se ejecutan en la propia infraestructura en la nube de RetainDB: solo proporcionas una RETAINDB_KEY. La extracción de memoria usa Claude Sonnet del lado del servidor. No hay opción de autoalojamiento ni modo local. Todos los datos de la conversación se envían a los servidores de RetainDB para procesamiento y almacenamiento. Si la soberanía de datos o la operación sin conexión son importantes para tu caso de uso, este proveedor no es adecuado.
Herramientas: retaindb_profile (perfil de usuario), retaindb_search (búsqueda semántica), retaindb_context (contexto relevante para la tarea), retaindb_remember (almacenar con tipo + importancia), retaindb_forget (eliminar memorias).
Configuración:
hermes memory setup # seleccionar "retaindb"
ByteRover
Ideal para: memoria local primero con almacenamiento legible por humanos y auditable.
ByteRover almacena la memoria como un árbol de contexto markdown estructurado: una jerarquía de archivos de dominio, tema y subtema, en lugar de vectores de incrustación o una base de datos. Un LLM lee el contenido fuente, razona sobre él y coloca el conocimiento extraído en la ubicación correcta de la jerarquía. La recuperación es búsqueda de texto completo MiniSearch con retroceso escalonado a búsqueda impulsada por LLM, sin necesidad de base de datos vectorial.
Dependencias externas: ByteRover requiere un LLM para la curación de memoria y búsqueda (se soportan 18 proveedores, incluidos Anthropic, OpenAI, Google, Ollama y cualquier punto final compatible con OpenAI mediante el slot de proveedor openai-compatible). No requiere modelo de incrustación ni base de datos: el árbol de contexto es un directorio local de archivos markdown planos. La sincronización en la nube es opcional y se usa solo para colaboración en equipo; todo funciona completamente sin conexión por defecto. Para una configuración local totalmente autónoma, conecta Ollama como proveedor (brv providers connect openai-compatible --base-url http://localhost:11434/v1) y ningún dato sale de tu máquina.
Herramientas: 3 herramientas para operaciones de memoria.
Configuración:
hermes memory setup # seleccionar "byterover"
Supermemory
Ideal para: flujos de trabajo empresariales con cierre de contexto e ingestión de grafo de sesión.
Supermemory proporciona cierre de contexto (aislando la memoria por contexto) e ingestión de grafo de sesión (importando historiales de conversación completos). Extrae memorias automáticamente, construye perfiles de usuario y ejecuta recuperación híbrida combinando búsqueda semántica y de palabras clave. La API de nube gestionada es el objetivo principal de despliegue.
Dependencias externas: El servicio en la nube de Supermemory maneja toda la inferencia LLM y el servidor de incrustaciones del lado del servidor: solo proporcionas una clave API de Supermemory. El autoalojamiento está disponible exclusivamente como un complemento de plan empresarial y se despliega en Cloudflare Workers; requiere que proporciones PostgreSQL con la extensión pgvector (para almacenamiento vectorial) y una clave API de OpenAI (obligatoria, con Anthropic y Gemini como adiciones opcionales). No hay ruta de autoalojamiento basada en Docker o local: la arquitectura está estrechamente acoplada al cómputo perimetral de Cloudflare Workers. Para usuarios que necesitan soberanía de datos completa sin un contrato empresarial, este proveedor no es la opción correcta.
Herramientas: 4 herramientas para operaciones de memoria.
Configuración:
hermes memory setup # seleccionar "supermemory"
Cómo elegir
- ¿Necesitas soporte multiagente? Honcho
- ¿Quieres autoalojado y gratis? OpenViking o Holographic
- ¿Quieres cero configuración? Mem0
- ¿Quieres grafos de conocimiento? Hindsight
- ¿Quieres compresión delta? RetainDB
- ¿Quieres eficiencia de ancho de banda? ByteRover
- ¿Quieres características empresariales? Supermemory
- ¿Quieres privacidad (solo local)? Holographic
- ¿Quieres totalmente local sin servicios externos? Holographic (sin dependencias en absoluto) o Hindsight/Mem0/ByteRover con Ollama
- ¿Quieres memoria legible por humanos y auditable sin pipeline de incrustación? ByteRover
Para configuraciones de proveedores por perfil y patrones de flujo de trabajo del mundo real, consulta Configuración de producción de Hermes Agent.
Guías relacionadas
- Centro de memoria de sistemas de IA — ámbito de este subclúster y enlaces a guías de Cognee
- Sistema de memoria de Hermes Agent — memoria central de dos archivos antes de los complementos
- Configuración de producción de Hermes Agent — cableado de perfiles para proveedores en la práctica