SelfHosting

Mantenimiento del Wiki de LLM: Deriva, Contradicciones y Revisión

Un wiki de LLM falla cuando los datos antiguos siguen siendo plausibles, las contradicciones se vuelven pulidas y los resúmenes generados se desvían de sus fuentes.

Sincronización de archivos con Syncthing para sistemas de conocimiento autoalojados

Syncthing mantiene los archivos sincronizados entre los dispositivos que controlas, lo que lo convierte en una de las herramientas más prácticas para una infraestructura de conocimiento autoalojada que evita la dependencia de la nube.

GPU para IA en 2026: NVIDIA, AMD e Intel comparadas

El panorama del hardware para IA ha cambiado significativamente en 2026, con NVIDIA, AMD e Intel compitiendo por los desarrolladores que necesitan GPUs capaces de ejecutar modelos de lenguaje grandes (LLM) locales y cargas de trabajo de inferencia de IA.

Agente Hermes: Servidor sin cabeza + Configuración de escritorio remoto

Ejecutar Hermes Agent en un servidor sin interfaz gráfica (headless) mientras se conecta desde un cliente de escritorio en otra máquina requiere dos procesos de servidor y una conexión de cliente.

Ejecutar Docker Compose como un servicio de Linux con systemd

Docker Compose en un servidor Linux debe iniciarse al arranque, detenerse correctamente al apagarse y sobrevivir a los reinicios sin intervención manual.

Instalar Docker en Ubuntu: APT, Snap, Rootless — Guía completa 2026

La instalación de Docker en Ubuntu debería ser sencilla, pero en la práctica, varias opciones con forma de Docker compiten por el mismo nombre de comando, cada una con diferente empaquetado, comportamiento de actualización e implicaciones de seguridad.

Solución de problemas de APT en Ubuntu: reparación de paquetes rotos, retenciones y errores de GPG

Los fallos de APT son comunes en máquinas Ubuntu de larga vida útil, y suelen aparecer después de una actualización de versión, un cambio en un repositorio de terceros, la eliminación de un PPA, la instalación manual de un .deb o una instalación de paquetes interrumpida.

La memoria transforma a los asistentes de reactivos a persistentes, pero también es donde muchos sistemas se deterioran silenciosamente. Las encuestas argumentan que la división entre memoria a corto y largo plazo ya no es suficiente para la memoria de los agentes modernos; los SDK de OpenAI y LangGraph apuntan a una arquitectura más simple: memoria de trabajo, estado duradero y recuperación.

OpenClaw vs. Hermes Agent: Estrellas, Descargas y Uso en 2026

Los frameworks de agentes de IA de código abierto están experimentando un aumento explosivo en popularidad en GitHub. Dos proyectos en el centro del ecosistema de sistemas de IA autoalojados — OpenClaw y Hermes Agent — han avanzado tanto que el resto del campo lucha por un distante tercer lugar.

Qwen 3.6 27B y 35B MTP frente a estándar en GPU de 16 GB

Probé el rendimiento de la decodificación especulativa (Predicción Multitoken, MTP) en Qwen 3.6 27B y 35B en una RTX 4080 con 16 GB de VRAM.

Descargar todos los modelos del enrutador de llama.cpp sin reiniciar

Modo router de llama.cpp es uno de los cambios más útiles en llama-server en años. Finalmente ofrece a los operadores de LLM locales una experiencia de gestión de modelos cercana a la que las personas esperan de Ollama, manteniendo al mismo tiempo el rendimiento bruto y el control a bajo nivel que hacen que llama.cpp valga la pena usarlo en primer lugar.

Referencia de parámetros de inferencia de LLMs agénticos para Qwen y Gemma

Esta página es una referencia práctica para la afinación de inferencia de LLMs agentivos (temperatura, top_p, top_k, penalizaciones y cómo interactúan en flujos de trabajo multietapa y con uso intensivo de herramientas).

Control de voz de Hermes desde tu teléfono

Ya puedes chatear con Hermes Agent desde tu teléfono usando texto. Ahora quieres hablar con él directamente y recibir respuestas habladas. Eso suele ser la mejor opción, especialmente si ya usas Hermes como asistente autohospedado persistente. Escribir instrucciones largas en una pantalla pequeña es lento y propenso a errores.

Kanban en Hermes Agent para flujos de trabajo de LLMs autoalojados

El agente Hermes incluye un tablero estilo Kanban y el Hermes Gateway, que pueden saturar su LLM autoalojado si se asignan demasiadas tareas a la vez.

Creación de habilidades del agente Hermes: estructura de SKILL.md y mejores prácticas

Hermes Agent trata las habilidades (skills) como la forma predeterminada de enseñar flujos de trabajo repetibles. La documentación oficial las describe como documentos de conocimiento bajo demanda alineados con la estructura abierta de agentskills.io, cargados mediante revelación progresiva para que el modelo vea primero un índice pequeño y solo recupere las instrucciones completas cuando una tarea realmente lo necesite.

Hoja de trucos del Hermes Agent CLI: comandos, banderas y accesos directos con barra

Hermes Agent de Nous Research es un asistente agnóstico al modelo, que utiliza herramientas y que puedes ejecutar localmente o en un VPS.