Asistente de IA Hermes: Instalación, Configuración, Flujo de Trabajo y Solución de Problemas

Instalación y guía de inicio rápido de Hermes Agent para desarrolladores

Índice

Hermes Agent es un asistente de IA autoalojado y agnóstico al modelo que se ejecuta en una máquina local o en un VPS de bajo coste, funciona a través de interfaces de terminal y mensajería, y mejora con el tiempo convirtiendo tareas repetidas en habilidades reutilizables.

Es muy similar en funcionalidad a OpenClaw, otro conjunto de herramientas de asistente autoalojado construido alrededor de herramientas, memoria y control local.

Si quieres una visión más amplia de los asistentes autoalojados, la recuperación y la infraestructura local alrededor de Hermes, esta visión general de los sistemas de IA vincula esos temas con los mismos problemas que Hermes intenta resolver.

Para las compensaciones de despliegue y las elecciones de tiempo de ejecución, Alojamiento de LLM en 2026: Infraestructura Local, Autoalojada y en la Nube Comparada proporciona el mapa de alojamiento, mientras que Rendimiento de LLM en 2026: Benchmarks, Cuellos de Botella y Optimización cubre el aspecto del rendimiento y la latencia una vez que Hermes está en ejecución.

peronal-ai-assistant on laptop

Mi opinión sesgada: Hermes es más interesante cuando se trata como infraestructura, no como una pestaña que se abre ocasionalmente. Una vez que se ejecuta como un servicio y tiene un directorio de inicio estable, tus prompts comienzan a parecer menos como un “chat” y más como “operaciones” (ops).

Qué es Hermes Agent y por qué importa

Hermes Agent es un agente de IA de código abierto desarrollado por Nous Research. Está diseñado para ejecutarse de forma persistente, utilizar herramientas (terminal, archivos, web, etc.) y mejorar su propio comportamiento con el tiempo mediante un sistema de habilidades y memoria.

Dos decisiones de diseño merecen ser explicadas porque dan forma a todo lo demás en esta guía.

En primer lugar, Hermes no está bloqueado en un solo proveedor de modelos. El flujo de configuración oficial soporta múltiples proveedores y cualquier endpoint compatible con OpenAI, y el cambio se realiza mediante el comando hermes model en lugar de editar el código.

En segundo lugar, Hermes traza una línea dura entre “conversación” y “ejecución”. El agente puede hablar todo el día, pero cuando necesita actuar, lo hace a través de herramientas explícitas y un backend de ejecución configurable. Ahí es donde residen la seguridad, la reproducibilidad y la solución de problemas.

Los costes y las licencias son refrescantemente aburridos. Hermes Agent en sí es software gratuito bajo la licencia MIT. Si utilizas modelos alojados, el coste continuo es lo que tu proveedor cobre. Si ejecutas modelos locales, puedes evitar por completo las tarifas de API.

Instalar Hermes Agent

Hermes tiene una ruta de instalación rápida para Linux, macOS y WSL2. La documentación oficial lo mantiene intencionadamente simple.

Instalación en una línea

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

Después de la instalación, recarga tu shell e inicia la CLI.

source ~/.bashrc   # o source ~/.zshrc
hermes

El instalador no es solo un envoltorio fino. Según la guía de instalación, configura las dependencias, el repositorio, un entorno virtual y el comando hermes, y luego te lleva a un estado inicial listo para chatear.

Notas para Windows y Android

Windows nativo no está soportado. La documentación recomienda WSL2 y ejecutar Hermes dentro de él.

Para Android, Hermes soporta una ruta de instalación de Termux. Está diseñado para detectar Termux y adaptar su configuración de dependencias y entorno en consecuencia.

Inicio rápido

La primera ejecución más rápida es literalmente solo hermes, pero un inicio rápido significativo implica dos decisiones adicionales: qué proveedor de modelos utilizar y qué herramientas deben habilitarse.

Elegir un proveedor y un modelo

Hermes expone tres puntos de entrada complementarios:

  • hermes model para elegir un proveedor y un modelo predeterminado
  • hermes tools para habilitar o deshabilitar conjuntos de herramientas
  • hermes setup para ejecutar un asistente interactivo a través de las principales áreas de configuración

Un flujo mínimo se ve así:

hermes model
hermes tools
hermes

En cuanto a lo que se soporta realmente, el Inicio Rápido oficial enumera una gama de proveedores y también señala que Hermes funciona con APIs compatibles con OpenAI. Esto importa porque incluye tanto servicios alojados como endpoints autoalojados.

Demostrar la ejecución de herramientas temprano

Antes de construir hábitos alrededor de Hermes, vale la pena verificar que el uso de herramientas funcione en tu entorno. El Inicio Rápido sugiere explícitamente el uso de la terminal como la primera característica a probar.

En la práctica, un pequeño prompt de “prueba de humo” hace dos cosas: verifica la herramienta de terminal y valida los prompts de permisos.

Ejemplo de prompt:

Muestra mi uso de disco y los cinco directorios más grandes.

Si Hermes no puede ejecutar la herramienta de terminal, salta directamente a Solución de problemas. La mala configuración del backend de terminal es una de las causas más comunes, y la solución suele ser obvia una vez que miras la configuración.

Configuración que escala

Hermes recompensa a quienes entienden dónde almacena el estado y cómo resuelve la configuración. Este es también el lugar de donde surgen muchos problemas de “funcionaba ayer”.

Dónde viven la configuración y el estado

Hermes almacena sus ajustes y estado bajo ~/.hermes. La guía de configuración oficial documenta la estructura, incluyendo config.yaml para ajustes, .env para secretos, auth.json para credenciales de OAuth, SOUL.md para identidad, y carpetas para memorias, habilidades, cron, sesiones y registros.

Esto importa por dos razones.

  • La depuración se vuelve mecánica porque sabes exactamente dónde mirar.
  • Las copias de seguridad se vuelven sencillas porque un solo directorio captura la mayor parte del estado del agente que te importa.

Precedencia de configuración y mantener los secretos fuera de config.yaml

Hermes resuelve la configuración con un orden de precedencia. En la cima están las sobrescrituras de CLI, luego config.yaml, luego .env, con los valores predeterminados integrados en la parte inferior.

El detalle agradable es que hermes config set enruta los valores al archivo correcto: las claves de API a .env y los ajustes no secretos a config.yaml.

hermes config set model openrouter/meta-llama/llama-3.1-70b-instruct
hermes config set terminal.backend docker
hermes config set OPENROUTER_API_KEY sk-or-v1-xxxxxxxx

Hermes también soporta la sustitución de variables de entorno dentro de config.yaml mediante la sintaxis ${NOMBRE_VAR}. Esto es útil cuando quieres mantener ciertos valores en el entorno mientras los referencias aún así en la configuración estructurada.

Sandbox y backends de ejecución

Hermes soporta múltiples backends de terminal que definen dónde se ejecutan realmente los comandos de shell. La guía de configuración enumera local, docker, ssh, modal, daytona y singularity.

La forma de pensar sobre esto, con opinión pero no evangelizadora, es:

  • local es el más rápido y simple, pero no está aislado
  • docker es una capa pragmática de seguridad y reproducibilidad
  • ssh es una forma limpia de separar tu dispositivo de chat de tu caja de cómputo
  • modal y daytona se ajustan a flujos de trabajo “sin servidor pero lo suficientemente persistentes”
  • singularity es la opción amigable para HPC

Un ejemplo mínimo de backend Docker:

# ~/.hermes/config.yaml
terminal:
  backend: docker
  docker_image: "nikolaik/python-nodejs:python3.11-nodejs20"
  docker_volumes:
    - "/home/user/projects:/workspace/projects"
  docker_forward_env:
    - "GITHUB_TOKEN"

La documentación también describe el endurecimiento de seguridad para el backend Docker, como la eliminación de capacidades y la desactivación de la escalada de privilegios.

Habilidades, memoria y perfiles

Hermes tiene dos mecanismos relacionados para compounding valor.

Las habilidades son memoria procedimental. Hermes puede crear, actualizar y eliminar sus propias habilidades y puede ofrecer guardar un enfoque como una habilidad después de completar una tarea compleja.

La memoria integrada se almacena como archivos como MEMORY.md y USER.md bajo ~/.hermes, y Hermes también puede utilizar proveedores de memoria externos para un recuerdo más profundo. La documentación de memoria enumera múltiples plugins de proveedores, y la guía de proveedores de memoria documenta un flujo de configuración interactivo.

Si quieres múltiples agentes independientes en la misma máquina, los perfiles de Hermes proporcionan aislamiento. Cada perfil obtiene su propio directorio con su propia configuración, secretos, memorias, sesiones, habilidades, trabajos cron y estado de gateway.

Flujo de trabajo típico

Si tratas a Hermes como un agente que mantendrás cerca, el flujo de trabajo comienza a parecerse a la ingeniería de servicios.

Una línea base estable

Una línea base que tiende a no deteriorarse es:

  1. Instalar y ejecutar un primer chat en la CLI.
  2. Elegir un proveedor y modelo con hermes model, luego confirmar los costes.
  3. Configurar conjuntos de herramientas y decidir si la ejecución de terminal es local o en sandbox.
  4. Hacer un cambio rápido en SOUL.md solo después de haber usado el predeterminado durante un tiempo. Los cambios de identidad importan más de lo que la gente espera porque es la “ranura 1” en el prompt del sistema.

Uso diario que se acumula

Hermes tiene una interfaz de terminal en lugar de una interfaz web, y está diseñado para sesiones largas con comandos de barra, sesiones reanudables y salida de herramientas en streaming.

En la práctica, un ritmo útil es:

  • ejecutar el trabajo en una sesión con nombre para un proyecto
  • comprimir el contexto cuando crece demasiado
  • dejar que Hermes convierta las rutinas repetidas en habilidades
  • mantener un límite mental entre “preguntar” y “actuar” para que la ejecución de herramientas sea auditable

Gateway de mensajería para acceso 24/7

El gateway de mensajería es la pieza que hace que Hermes se sienta como un asistente en lugar de una aplicación de terminal. La documentación lo describe como un único proceso que se conecta a múltiples plataformas, maneja sesiones, ejecuta trabajos cron y entrega mensajes.

La configuración se invoca mediante hermes gateway setup, y el gateway puede ejecutarse en primer plano o como un servicio de usuario. La referencia de la CLI documenta subcomandos de gateway como run, install, start, stop, status y restart.

La seguridad para un bot que utiliza herramientas importa. La documentación del gateway describe listas de permitidos para plataformas específicas y un flujo de emparejamiento de DM que emite códigos de emparejamiento de un solo uso y requiere aprobación mediante hermes pairing approve.

Actualizaciones sin drama

Las actualizaciones de Hermes son un comando de primera clase. La guía de actualización documenta hermes update, verificaciones de migración de configuración y una pequeña rutina de validación post-actualización que incluye hermes doctor y hermes gateway status.

hermes update
hermes doctor
hermes gateway status

Solución de problemas y diagnóstico

La mayoría de los fallos de Hermes no son misteriosos. Parecen misteriosos porque la gente solo verifica la capa del modelo e ignora la capa de tiempo de ejecución.

Comandos de triaje rápido

La referencia de la CLI posiciona explícitamente tres comandos como el bucle principal:

  • hermes doctor para diagnósticos interactivos
  • hermes status para una visión general rápida
  • hermes dump para un resumen de configuración compartible y censurado

Para los registros, hermes logs sigue los archivos almacenados bajo ~/.hermes/logs.

hermes doctor --fix
hermes status
hermes dump --show-keys
hermes logs errors -f

Fallos de instalación comunes

El FAQ y la guía de solución de problemas enumeran varios problemas recurrentes y sus soluciones, incluyendo problemas de versión de Python, uv no encontrado y problemas de permisos causados por mezclar instalaciones sudo con instalaciones de usuario.

Si encuentras estos errores, la documentación proporciona pasos de remediación específicos como actualizar Python, instalar uv y reinstalar Hermes sin sudo.

Problemas de proveedor y modelo

Cuando las claves de API no funcionan, el FAQ recomienda verificar la configuración, volver a ejecutar hermes model o establecer una clave directamente mediante hermes config set. También señala un error común: las claves son específicas del proveedor.

Para problemas de “modelo no encontrado”, el FAQ señala volver a utilizar hermes model para elegir un identificador válido y muestra tanto las sobrescrituras de configuración como las de sesión.

También se cubren problemas de limitación de tasa y longitud de contexto. El FAQ sugiere esperar errores 429, cambiar de proveedor o modelo, y reducir la presión del contexto mediante compresión o una sesión fresca.

Problemas de backend de terminal y gateway

Si los comandos de terminal fallan inmediatamente, la guía de configuración incluye una sección de “problemas comunes de backend de terminal” y señala las causas típicas por backend, incluyendo Docker no ejecutándose y variables SSH faltantes. También señala que volver a local es un movimiento de depuración válido cuando la configuración del sandbox está en cuestión.

Para problemas de gateway, la guía de mensajería destaca las listas de permitidos y el emparejamiento como los valores predeterminados seguros, lo que significa que muchos incidentes de “bot silencioso” son en realidad la autorización haciendo su trabajo.

Referencias