Asystent Hermes AI – instalacja, konfiguracja, przepływ pracy i rozwiązywanie problemów

Instalacja i szybki start Hermes Agent dla deweloperów

Page content

Hermes Agent to samodzielnie hostowany, niezależny od modelu asystent AI działający na lokalnej maszynie lub taniej VPS, pracujący przez interfejs terminala oraz komunikatorów, który z czasem się ulepsza, zamieniając powtarzalne zadania w ponownie używalne umiejętności.

Pod względem funkcjonalności jest bardzo podobny do OpenClaw, innego stosu asystenta opartego na narzędziach, pamięci i lokalnej kontroli.

Jeśli chcesz zrozumieć szerszy obraz samodzielnie hostowanych asystentów, odzyskiwania danych i lokalnej infrastruktury wokół Hermes, ten przegląd systemów AI powiązuje te tematy z problemami, które Hermes próbuje rozwiązać.

W kwestii kompromisów związanych z wdrożeniem i wyborów środowiska uruchomieniowego, Hostowanie LLM w 2026: Lokalne, Samodzielnie Hostowane i Chmura Porównane dostarcza mapy hostowania, podczas gdy Wydajność LLM w 2026: Testy, Butleki i Optymalizacja obejmuje aspekt przepustowości i opóźnień po uruchomieniu Hermes.

peronal-ai-assistant on laptop

Moje stronnicze zdanie: Hermes jest najbardziej interesujący, gdy traktowany jest jako infrastruktura, a nie jako zakładka, którą otwiera się od czasu do czasu. Gdy działa jako usługa i ma stabilny katalog główny, Twoje prompty przestają wyglądać jak „czat", a zaczynają wyglądać jak „ops".

Czym jest Hermes Agent i dlaczego to ważne

Hermes Agent to open-source’owy agent AI stworzony przez Nous Research. Zaprojektowany jest do ciągłej pracy, wykorzystywania narzędzi (terminal, pliki, web i więcej) oraz poprawiania własnego zachowania w czasie dzięki systemowi umiejętności i pamięci.

Dwa wybory projektowe są warte omówienia, ponieważ kształtują wszystko inne w tym przewodniku.

Po pierwsze, Hermes nie jest przypięty do jednego dostawcy modelu. Oficjalny przepływ konfiguracji obsługuje wielu dostawców i każdy endpoint kompatybilny z OpenAI, a przełączanie odbywa się za pomocą polecenia hermes model, a nie poprzez edycję kodu.

Po drugie, Hermes stawia twardą kreskę między „rozmową" a „wykonaniem". Agent może rozmawiać cały dzień, ale gdy musi działać, robi to poprzez wyraźne narzędzia i konfigurowalne środowisko wykonania. To tam mieszczą się bezpieczeństwo, powtarzalność i rozwiązywanie problemów.

Koszty i licencjonowanie są odświeżająco nudne. Sam Hermes Agent to darmowe oprogramowanie na licencji MIT. Jeśli używasz hostowanych modeli, bieżący koszt to to, co pobiera Twój dostawca. Jeśli uruchamiasz lokalne modele, możesz całkowicie uniknąć opłat za API.

Instalacja Hermes Agent

Hermes posiada szybką ścieżkę instalacji dla Linuxa, macOS i WSL2. Oficjalna dokumentacja celowo utrzymuje ją w prostocie.

Instalacja w jednej linii

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

Po instalacji przeładuj powłokę i uruchom CLI.

source ~/.bashrc   # lub source ~/.zshrc
hermes

Instalator to nie tylko cienka nakładka. Zgodnie z przewodnikiem instalacyjnym, konfiguruje zależności, repozytorium, wirtualne środowisko oraz polecenie hermes, prowadząc Cię do pierwszego stanu gotowego do czatu.

Uwagi dotyczące Windowsa i Androida

Natywne Windows nie jest obsługiwane. Dokumentacja zaleca WSL2 i uruchamianie Hermes w jego wnętrzu.

Dla Androida, Hermes obsługuje ścieżkę instalacji Termux. Zaprojektowano go tak, aby wykrywał Termux i dostosowywał konfigurację zależności i środowiska odpowiednio.

Szybki Start

Najszybszym pierwszym uruchomieniem jest dosłownie tylko hermes, ale wartościowy szybki start oznacza dwie dodatkowe decyzje: który dostawca modelu ma być użyty i które zestawy narzędzi mają być włączone.

Wybór dostawcy i modelu

Hermes udostępnia trzy uzupełniające się punkty wejścia:

  • hermes model do wyboru dostawcy i domyślnego modelu
  • hermes tools do włączania lub wyłączania zestawów narzędzi
  • hermes setup do uruchomienia interaktywnego kreatora w kluczowych obszarach konfiguracji

Minimalny przepływ wygląda tak:

hermes model
hermes tools
hermes

Pod kątem tego, co jest faktycznie obsługiwane, oficjalny Szybki Start wymienia zakres dostawców i wskazuje, że Hermes działa z API kompatybilnymi z OpenAI. To ma znaczenie, ponieważ obejmuje zarówno usługi hostowane, jak i endpointy samodzielnie hostowane.

Wczesne potwierdzenie wykonywania narzędzi

Zanim zbudujesz nawyki wokół Hermes, warto zweryfikować, czy używanie narzędzi działa w Twoim środowisku. Szybki Start wyraźnie sugeruje użycie terminala jako pierwszej funkcji do przetestowania.

W praktyce, mały „test dymny" (smoke test) wykonuje dwie prace: sprawdza narzędzie terminala i waliduje komunikaty o uprawnieniach.

Przykładowy prompt:

Pokaż użycie dysku i pięć największych katalogów.

Jeśli Hermes nie może uruchomić narzędzia terminala, przejdź do Rozwiązywania problemów. Nieprawidłowa konfiguracja backendu terminala jest jedną z najczęstszych przyczyn, a naprawa jest zazwyczaj oczywista po spojrzeniu na konfigurację.

Konfiguracja, która skaluje się

Hermes nagradza osoby, które rozumieją, gdzie przechowuje stan i jak rozwiązuje konfigurację. To również miejsce, skąd biorą się wiele problemów typu „działało to wczoraj".

Gdzie mieszczą się konfiguracja i stan

Hermes przechowuje swoje ustawienia i stan w katalogu ~/.hermes. Oficjalny przewodnik konfiguracji dokumentuje układ, w tym config.yaml dla ustawień, .env dla haseł, auth.json dla poświadczeń OAuth, SOUL.md dla tożsamości oraz foldery dla pamięci, umiejętności, zadań cron, sesji i logów.

To ma znaczenie z dwóch powodów.

  • Rozwiązywanie problemów staje się mechaniczne, ponieważ wiesz dokładnie, gdzie szukać.
  • Tworzenie kopii zapasowych staje się proste, ponieważ jeden katalog przechwytuje większość stanu agenta, który Cię interesuje.

Priorytety konfiguracji i zabezpieczanie haseł przed config.yaml

Hermes rozwiązuje konfigurację w kolejności priorytetów. Na szczycie są nadpisanie z CLI, następnie config.yaml, potem .env, z wbudowanymi wartościami domyślnymi na dole.

Miłym szczegółem jest to, że hermes config set kieruje wartości do odpowiednich plików: klucze API do .env, a ustawienia nie będące secretami do config.yaml.

hermes config set model openrouter/meta-llama/llama-3.1-70b-instruct
hermes config set terminal.backend docker
hermes config set OPENROUTER_API_KEY sk-or-v1-xxxxxxxx

Hermes obsługuje również podstawienie zmiennych środowiskowych wewnątrz config.yaml za pomocą składni ${VAR_NAME}. Jest to przydatne, gdy chcesz zachować pewne wartości w zmiennych środowiskowych, a jednocześnie odwoływać się do nich w strukturalnej konfiguracji.

Piaskownice i backendy wykonania

Hermes obsługuje wiele backendów terminala, które definiują, gdzie faktycznie wykonują się polecenia powłoki. Przewodnik konfiguracji wymienia: local, docker, ssh, modal, daytona i singularity.

Opiniowany, ale nie ewangelizujący sposób myślenia o tym wygląda tak:

  • local jest najszybsze i najprostsze, ale nie jest izolowane
  • docker to pragmatyczna warstwa bezpieczeństwa i powtarzalności
  • ssh to czysty sposób na oddzielenie urządzenia czatowego od maszyny obliczeniowej
  • modal i daytona pasują do przepływów pracy „bezserwerowych, ale wystarczająco trwałych"
  • singularity to opcja przyjazna HPC

Minimalny przykład backendu Docker:

# ~/.hermes/config.yaml
terminal:
  backend: docker
  docker_image: "nikolaik/python-nodejs:python3.11-nodejs20"
  docker_volumes:
    - "/home/user/projects:/workspace/projects"
  docker_forward_env:
    - "GITHUB_TOKEN"

Dokumentacja opisuje również zabezpieczenia backendu Docker, takie jak usuwanie uprawnień i wyłączenie eskalacji przywilejów.

Umiejętności, pamięć i profile

Hermes posiada dwa powiązane mechanizmy do wzmacniania wartości.

Umiejętności to pamięć proceduralna. Hermes może tworzyć, aktualizować i usuwać własne umiejętności oraz może zaoferować zapisanie podejścia jako umiejętność po ukończeniu złożonego zadania.

Wbudowana pamięć jest przechowywana jako pliki takie jak MEMORY.md i USER.md pod ~/.hermes, a Hermes może również używać zewnętrznych dostawców pamięci do głębszego odzyskiwania informacji. Dokumentacja pamięci wymienia wiele wtyczek dostawców, a przewodnik po dostawcach pamięci dokumentuje interaktywny przepływ konfiguracji.

Jeśli chcesz mieć wiele niezależnych agentów na tym samym komputerze, profile Hermes zapewniają izolację. Każdy profil otrzymuje własny katalog z własną konfiguracją, sekretami, pamięciami, sesjami, umiejętnościami, zadaniami cron i stanem bramy.

Typowy przepływ pracy

Jeśli traktujesz Hermes jak agenta, z którym będziesz pracować, przepływ pracy zaczyna wyglądać jak inżynieria usług.

Stabilna baza

Baza, która zazwyczaj nie psuje się, to:

  1. Zainstaluj i uruchom pierwszy czat w CLI.
  2. Wybierz dostawcę i model za pomocą hermes model, a następnie potwierdź koszty.
  3. Skonfiguruj zestawy narzędzi i zdecyduj, czy wykonanie terminala ma być lokalne, czy w piaskownicy.
  4. Wprowadź szybką zmianę w SOUL.md dopiero po pewnym czasie używania domyślnych ustawień. Zmiany tożsamości mają większe znaczenie, niż ludzie się spodziewają, ponieważ jest to „slot 1" w systemowym prompcie.

Codzienne użytkowanie, które się kumuluje

Hermes posiada interfejs terminala, a nie interfejs webowy, i jest zaprojektowany do długich sesji z poleceniami slash, sesjami wznowialnymi i strumieniowym wyjściem narzędzi.

W praktyce, użyteczny rytm to:

  • wykonywanie pracy w nazwanej sesji dla projektu
  • kompresowanie kontekstu, gdy staje się zbyt duży
  • pozwolenie Hermesowi na zamienianie powtarzalnych rutyn w umiejętności
  • utrzymanie mentalnej granicy między „zapytaj" a „działaj", aby wykonanie narzędzi pozostawało audytowalne

Bramka komunikacyjna dla dostępu 24/7

Bramka komunikacyjna to element, który sprawia, że Hermes czuje się jak asystent, a nie aplikacja terminala. Dokumentacja opisuje ją jako pojedynczy proces, który podłącza się do wielu platform, obsługuje sesje, uruchamia zadania cron i dostarcza wiadomości.

Konfiguracja jest wywoływana za pomocą hermes gateway setup, a bramka może działać w pierwszym planie lub jako usługa użytkownika. Referencja CLI dokumentuje podpolecenia bramki takie jak run, install, start, stop, status i restart.

Bezpieczeństwo dla bota używającego narzędzi ma znaczenie. Dokumentacja bramki opisuje listy dozwolonych dla konkretnych platform oraz przepływ parowania DM, który wydaje jednorazowe kody parowania i wymaga zatwierdzenia za pomocą hermes pairing approve.

Aktualizacje bez dramy

Aktualizacje Hermes to polecenie pierwszej klasy. Przewodnik aktualizacji dokumentuje hermes update, sprawdzenia migracji konfiguracji oraz małą rutynę weryfikacji po aktualizacji, w tym hermes doctor i hermes gateway status.

hermes update
hermes doctor
hermes gateway status

Rozwiązywanie problemów i diagnostyka

Większość awarii Hermes nie jest tajemnicza. Wyglądają tajemniczo, ponieważ ludzie sprawdzają tylko warstwę modelu i ignorują warstwę środowiska uruchomieniowego.

Szybkie polecenia triażu

Referencja CLI wyraźnie pozycjonuje trzy polecenia jako pętlę główną:

  • hermes doctor dla interaktywnej diagnostyki
  • hermes status dla szybkiego przeglądania
  • hermes dump dla udostępnialnego, zredagowanego podsumowania konfiguracji

Dla logów, hermes logs wyświetla pliki przechowywane pod ~/.hermes/logs.

hermes doctor --fix
hermes status
hermes dump --show-keys
hermes logs errors -f

Częste błędy instalacji

FAQ i przewodnik rozwiązywania problemów wymienia kilka nawracających problemów i ich napraw, w tym problemy z wersją Pythona, brak uv oraz problemy z uprawnieniami spowodowane mieszaniem instalacji sudo z instalacjami użytkownika.

Jeśli napotkasz te błędy, dokumentacja zapewnia konkretne kroki naprawcze, takie jak aktualizacja Pythona, instalacja uv i ponowna instalacja Hermes bez sudo.

Problemy z dostawcą i modelem

Gdy klucze API nie działają, FAQ zaleca sprawdzenie konfiguracji, ponowne uruchomienie hermes model lub ustawienie klucza bezpośrednio przez hermes config set. Wskazuje również na częstą pułapkę: klucze są specyficzne dla dostawcy.

Dla problemów „model nie znaleziony", FAQ odsyła do użycia hermes model, aby wybrać ważny identyfikator i pokazuje zarówno nadpisanie konfiguracji, jak i nadpisanie sesji.

Zakończone są również kwestie ograniczania przepustowości i długości kontekstu. FAQ sugeruje czekanie na błędy 429, przełączanie dostawców lub modeli oraz zmniejszanie presji kontekstowej poprzez kompresję lub nową sesję.

Problemy z backendem terminala i bramką

Jeśli polecenia terminala zawalają się natychmiastowo, przewodnik konfiguracji zawiera sekcję „częste problemy z backendem terminala" i wskazuje typowe przyczyny dla każdego backendu, w tym brak działającego Dockera i brakujące zmienne SSH. Zauważa również, że powrót do lokalnego backendu jest ważnym krokiem diagnostycznym, gdy konfiguracja piaskownicy jest w kwestii.

Dla problemów z bramką, przewodnik komunikacyjny podkreśla listy dozwolonych i parowanie jako bezpieczne domyślne ustawienia, co oznacza, że wiele incydentów „bot jest cichy" to tak naprawdę autoryzacja wykonująca swoją pracę.

Referencje