SelfHosting

Maintenance de l'encyclopedia LLM : dérive, contradictions et révision

Un wiki LLM échoue lorsque les faits anciens restent plausibles, les contradictions deviennent polies et les résumés générés dérivent de leurs sources.

Syncthing pour la synchronisation de fichiers dans les systèmes de connaissances auto-hébergés

Syncthing synchronise les fichiers entre les appareils que vous contrôlez, ce qui en fait l’un des outils les plus pratiques pour une infrastructure de connaissances auto-hébergée qui évite la dépendance aux fournisseurs de cloud.

GPU pour l’IA en 2026 : NVIDIA, AMD et Intel comparés

Le paysage du matériel pour l’IA a considérablement évolué en 2026, avec NVIDIA, AMD et Intel qui rivalisent tous pour attirer les développeurs ayant besoin de GPU capables d’exécuter localement de grands modèles de langage (LLM) et des charges de travail d’inférence IA.

Agent Hermes : Configuration d’un serveur headless et d’un bureau à distance

Exécuter l’agent Hermes sur un serveur sans interface graphique (headless) tout en se connectant depuis un client de bureau sur une autre machine nécessite deux processus serveur et une seule connexion client.

Exécuter Docker Compose en tant que service Linux avec systemd

Docker Compose sur un serveur Linux doit démarrer au boot, s’arrêter proprement à l’extinction et survivre aux redémarrages sans intervention manuelle.

Installer Docker sur Ubuntu : APT, Snap, Rootless — Guide complet 2026

L’installation de Docker sur Ubuntu devrait être simple, mais en pratique, plusieurs options « en forme de Docker » rivalisent pour le même nom de commande, chacune avec sa propre gestion des paquets, son comportement de mise à jour et ses implications en matière de sécurité.

Dépannage d'APT sous Ubuntu : Corriger les paquets cassés, les retenues et les erreurs GPG

Les échecs d’APT sont courants sur les machines Ubuntu de longue durée, et ils apparaissent généralement après une mise à niveau de version, un changement de dépôt tiers, la suppression d’un PPA, l’installation manuelle d’un fichier .deb ou une installation de paquets interrompue.

Systèmes de mémoire dans les assistants IA

La mémoire transforme les assistants d’entités réactives en entités persistantes, mais c’est aussi là que de nombreux systèmes pourrissent silencieusement. Les enquêtes soutiennent que la distinction entre mémoire à court terme et à long terme n’est plus suffisante pour la mémoire des agents modernes ; les SDKs OpenAI et LangGraph pointent vers une pile plus simple — mémoire de travail, état durable et récupération.

OpenClaw vs Agent Hermes : Étoiles, Téléchargements et Utilisations en 2026

Les frameworks d’agents IA open-source connaissent une popularité explosive sur GitHub. Deux projets au cœur de l’écosystème des systèmes IA auto-hébergés — OpenClaw et Hermes Agent — ont pris une telle avance que le reste du domaine se bat pour une lointaine troisième place.

Qwen 3.6 27B et 35B MTP par rapport au standard sur GPU 16 Go

J’ai testé les performances de la décodage spéculatif (Multi-Token Prediction, MTP) sur les modèles Qwen 3.6 27B et 35B avec une RTX 4080 dotée de 16 Go de VRAM.

Charger tous les modèles du routeur llama.cpp sans redémarrage

Mode routeur de llama.cpp est l’un des changements les plus utiles apportés à llama-server depuis des années. Il offre enfin aux opérateurs de LLM locaux une expérience de gestion des modèles proche de celle attendue d’Ollama, tout en conservant les performances brutes et le contrôle de bas niveau qui rendent llama.cpp intéressant à utiliser en premier lieu.

Référence des paramètres d'inférence des LLMs agissants pour Qwen et Gemma

Cette page est une référence pratique pour l’optimisation de l’inférence des LLMs agents (température, top_p, top_k, pénalités, et comment ils interagissent dans les flux de travail multi-étapes et intensifs en outils).

Contrôle vocal d'Hermes depuis votre téléphone

Vous discutez déjà avec l’agent Hermes depuis votre téléphone par messages texte. Vous souhaitez désormais lui parler directement et recevoir des réponses vocales. C’est généralement la bonne approche, surtout si vous utilisez déjà Hermes comme assistant auto-hébergé persistant. Taper de longs prompts sur un petit écran est lent et sujet aux erreurs.

Kanban dans Hermes Agent pour les flux de travail d'LLM auto-hébergés

Hermes Agent est livré avec un tableau Kanban et la passerelle Hermes qui peuvent saturer votre LLM auto-hébergé si trop de tâches sont expédiées simultanément.

Création de compétences pour l'agent Hermes — Structure de SKILL.md et bonnes pratiques

Hermes Agent considère les compétences (skills) comme la méthode par défaut pour enseigner des flux de travail répétables. La documentation officielle les décrit comme des documents de connaissances sur demande, alignés sur le format ouvert agentskills.io, chargés via une révélation progressive afin que le modèle voie d’abord un index réduit et n’extraye les instructions complètes que lorsqu’une tâche en a réellement besoin.

Guide de référence Hermes Agent CLI — commandes, drapeaux et raccourcis slash

L’agent Hermes de Nous Research est un assistant agnostique du modèle et utilisant des outils que vous exécutez localement ou sur un VPS.