Asystent Hermes AI – instalacja, konfiguracja, przepływ pracy i rozwiązywanie problemów
Instalacja i szybki start Hermes Agent dla deweloperów
Hermes Agent to samodzielnie hostowany, niezależny od modelu asystent AI działający na lokalnej maszynie lub taniej VPS, pracujący przez interfejs terminala oraz komunikatorów, który z czasem się ulepsza, zamieniając powtarzalne zadania w ponownie używalne umiejętności.
Pod względem funkcjonalności jest bardzo podobny do OpenClaw, innego stosu asystenta opartego na narzędziach, pamięci i lokalnej kontroli.
Jeśli chcesz zrozumieć szerszy obraz samodzielnie hostowanych asystentów, odzyskiwania danych i lokalnej infrastruktury wokół Hermes, ten przegląd systemów AI powiązuje te tematy z problemami, które Hermes próbuje rozwiązać.
W kwestii kompromisów związanych z wdrożeniem i wyborów środowiska uruchomieniowego, Hostowanie LLM w 2026: Lokalne, Samodzielnie Hostowane i Chmura Porównane dostarcza mapy hostowania, podczas gdy Wydajność LLM w 2026: Testy, Butleki i Optymalizacja obejmuje aspekt przepustowości i opóźnień po uruchomieniu Hermes.

Moje stronnicze zdanie: Hermes jest najbardziej interesujący, gdy traktowany jest jako infrastruktura, a nie jako zakładka, którą otwiera się od czasu do czasu. Gdy działa jako usługa i ma stabilny katalog główny, Twoje prompty przestają wyglądać jak „czat", a zaczynają wyglądać jak „ops".
Czym jest Hermes Agent i dlaczego to ważne
Hermes Agent to open-source’owy agent AI stworzony przez Nous Research. Zaprojektowany jest do ciągłej pracy, wykorzystywania narzędzi (terminal, pliki, web i więcej) oraz poprawiania własnego zachowania w czasie dzięki systemowi umiejętności i pamięci.
Dwa wybory projektowe są warte omówienia, ponieważ kształtują wszystko inne w tym przewodniku.
Po pierwsze, Hermes nie jest przypięty do jednego dostawcy modelu. Oficjalny przepływ konfiguracji obsługuje wielu dostawców i każdy endpoint kompatybilny z OpenAI, a przełączanie odbywa się za pomocą polecenia hermes model, a nie poprzez edycję kodu.
Po drugie, Hermes stawia twardą kreskę między „rozmową" a „wykonaniem". Agent może rozmawiać cały dzień, ale gdy musi działać, robi to poprzez wyraźne narzędzia i konfigurowalne środowisko wykonania. To tam mieszczą się bezpieczeństwo, powtarzalność i rozwiązywanie problemów.
Koszty i licencjonowanie są odświeżająco nudne. Sam Hermes Agent to darmowe oprogramowanie na licencji MIT. Jeśli używasz hostowanych modeli, bieżący koszt to to, co pobiera Twój dostawca. Jeśli uruchamiasz lokalne modele, możesz całkowicie uniknąć opłat za API.
Instalacja Hermes Agent
Hermes posiada szybką ścieżkę instalacji dla Linuxa, macOS i WSL2. Oficjalna dokumentacja celowo utrzymuje ją w prostocie.
Instalacja w jednej linii
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
Po instalacji przeładuj powłokę i uruchom CLI.
source ~/.bashrc # lub source ~/.zshrc
hermes
Instalator to nie tylko cienka nakładka. Zgodnie z przewodnikiem instalacyjnym, konfiguruje zależności, repozytorium, wirtualne środowisko oraz polecenie hermes, prowadząc Cię do pierwszego stanu gotowego do czatu.
Uwagi dotyczące Windowsa i Androida
Natywne Windows nie jest obsługiwane. Dokumentacja zaleca WSL2 i uruchamianie Hermes w jego wnętrzu.
Dla Androida, Hermes obsługuje ścieżkę instalacji Termux. Zaprojektowano go tak, aby wykrywał Termux i dostosowywał konfigurację zależności i środowiska odpowiednio.
Szybki Start
Najszybszym pierwszym uruchomieniem jest dosłownie tylko hermes, ale wartościowy szybki start oznacza dwie dodatkowe decyzje: który dostawca modelu ma być użyty i które zestawy narzędzi mają być włączone.
Wybór dostawcy i modelu
Hermes udostępnia trzy uzupełniające się punkty wejścia:
hermes modeldo wyboru dostawcy i domyślnego modeluhermes toolsdo włączania lub wyłączania zestawów narzędzihermes setupdo uruchomienia interaktywnego kreatora w kluczowych obszarach konfiguracji
Minimalny przepływ wygląda tak:
hermes model
hermes tools
hermes
Pod kątem tego, co jest faktycznie obsługiwane, oficjalny Szybki Start wymienia zakres dostawców i wskazuje, że Hermes działa z API kompatybilnymi z OpenAI. To ma znaczenie, ponieważ obejmuje zarówno usługi hostowane, jak i endpointy samodzielnie hostowane.
Wczesne potwierdzenie wykonywania narzędzi
Zanim zbudujesz nawyki wokół Hermes, warto zweryfikować, czy używanie narzędzi działa w Twoim środowisku. Szybki Start wyraźnie sugeruje użycie terminala jako pierwszej funkcji do przetestowania.
W praktyce, mały „test dymny" (smoke test) wykonuje dwie prace: sprawdza narzędzie terminala i waliduje komunikaty o uprawnieniach.
Przykładowy prompt:
Pokaż użycie dysku i pięć największych katalogów.
Jeśli Hermes nie może uruchomić narzędzia terminala, przejdź do Rozwiązywania problemów. Nieprawidłowa konfiguracja backendu terminala jest jedną z najczęstszych przyczyn, a naprawa jest zazwyczaj oczywista po spojrzeniu na konfigurację.
Konfiguracja, która skaluje się
Hermes nagradza osoby, które rozumieją, gdzie przechowuje stan i jak rozwiązuje konfigurację. To również miejsce, skąd biorą się wiele problemów typu „działało to wczoraj".
Gdzie mieszczą się konfiguracja i stan
Hermes przechowuje swoje ustawienia i stan w katalogu ~/.hermes. Oficjalny przewodnik konfiguracji dokumentuje układ, w tym config.yaml dla ustawień, .env dla haseł, auth.json dla poświadczeń OAuth, SOUL.md dla tożsamości oraz foldery dla pamięci, umiejętności, zadań cron, sesji i logów.
To ma znaczenie z dwóch powodów.
- Rozwiązywanie problemów staje się mechaniczne, ponieważ wiesz dokładnie, gdzie szukać.
- Tworzenie kopii zapasowych staje się proste, ponieważ jeden katalog przechwytuje większość stanu agenta, który Cię interesuje.
Priorytety konfiguracji i zabezpieczanie haseł przed config.yaml
Hermes rozwiązuje konfigurację w kolejności priorytetów. Na szczycie są nadpisanie z CLI, następnie config.yaml, potem .env, z wbudowanymi wartościami domyślnymi na dole.
Miłym szczegółem jest to, że hermes config set kieruje wartości do odpowiednich plików: klucze API do .env, a ustawienia nie będące secretami do config.yaml.
hermes config set model openrouter/meta-llama/llama-3.1-70b-instruct
hermes config set terminal.backend docker
hermes config set OPENROUTER_API_KEY sk-or-v1-xxxxxxxx
Hermes obsługuje również podstawienie zmiennych środowiskowych wewnątrz config.yaml za pomocą składni ${VAR_NAME}. Jest to przydatne, gdy chcesz zachować pewne wartości w zmiennych środowiskowych, a jednocześnie odwoływać się do nich w strukturalnej konfiguracji.
Piaskownice i backendy wykonania
Hermes obsługuje wiele backendów terminala, które definiują, gdzie faktycznie wykonują się polecenia powłoki. Przewodnik konfiguracji wymienia: local, docker, ssh, modal, daytona i singularity.
Opiniowany, ale nie ewangelizujący sposób myślenia o tym wygląda tak:
localjest najszybsze i najprostsze, ale nie jest izolowanedockerto pragmatyczna warstwa bezpieczeństwa i powtarzalnościsshto czysty sposób na oddzielenie urządzenia czatowego od maszyny obliczeniowejmodalidaytonapasują do przepływów pracy „bezserwerowych, ale wystarczająco trwałych"singularityto opcja przyjazna HPC
Minimalny przykład backendu Docker:
# ~/.hermes/config.yaml
terminal:
backend: docker
docker_image: "nikolaik/python-nodejs:python3.11-nodejs20"
docker_volumes:
- "/home/user/projects:/workspace/projects"
docker_forward_env:
- "GITHUB_TOKEN"
Dokumentacja opisuje również zabezpieczenia backendu Docker, takie jak usuwanie uprawnień i wyłączenie eskalacji przywilejów.
Umiejętności, pamięć i profile
Hermes posiada dwa powiązane mechanizmy do wzmacniania wartości.
Umiejętności to pamięć proceduralna. Hermes może tworzyć, aktualizować i usuwać własne umiejętności oraz może zaoferować zapisanie podejścia jako umiejętność po ukończeniu złożonego zadania.
Wbudowana pamięć jest przechowywana jako pliki takie jak MEMORY.md i USER.md pod ~/.hermes, a Hermes może również używać zewnętrznych dostawców pamięci do głębszego odzyskiwania informacji. Dokumentacja pamięci wymienia wiele wtyczek dostawców, a przewodnik po dostawcach pamięci dokumentuje interaktywny przepływ konfiguracji.
Jeśli chcesz mieć wiele niezależnych agentów na tym samym komputerze, profile Hermes zapewniają izolację. Każdy profil otrzymuje własny katalog z własną konfiguracją, sekretami, pamięciami, sesjami, umiejętnościami, zadaniami cron i stanem bramy.
Typowy przepływ pracy
Jeśli traktujesz Hermes jak agenta, z którym będziesz pracować, przepływ pracy zaczyna wyglądać jak inżynieria usług.
Stabilna baza
Baza, która zazwyczaj nie psuje się, to:
- Zainstaluj i uruchom pierwszy czat w CLI.
- Wybierz dostawcę i model za pomocą
hermes model, a następnie potwierdź koszty. - Skonfiguruj zestawy narzędzi i zdecyduj, czy wykonanie terminala ma być lokalne, czy w piaskownicy.
- Wprowadź szybką zmianę w
SOUL.mddopiero po pewnym czasie używania domyślnych ustawień. Zmiany tożsamości mają większe znaczenie, niż ludzie się spodziewają, ponieważ jest to „slot 1" w systemowym prompcie.
Codzienne użytkowanie, które się kumuluje
Hermes posiada interfejs terminala, a nie interfejs webowy, i jest zaprojektowany do długich sesji z poleceniami slash, sesjami wznowialnymi i strumieniowym wyjściem narzędzi.
W praktyce, użyteczny rytm to:
- wykonywanie pracy w nazwanej sesji dla projektu
- kompresowanie kontekstu, gdy staje się zbyt duży
- pozwolenie Hermesowi na zamienianie powtarzalnych rutyn w umiejętności
- utrzymanie mentalnej granicy między „zapytaj" a „działaj", aby wykonanie narzędzi pozostawało audytowalne
Bramka komunikacyjna dla dostępu 24/7
Bramka komunikacyjna to element, który sprawia, że Hermes czuje się jak asystent, a nie aplikacja terminala. Dokumentacja opisuje ją jako pojedynczy proces, który podłącza się do wielu platform, obsługuje sesje, uruchamia zadania cron i dostarcza wiadomości.
Konfiguracja jest wywoływana za pomocą hermes gateway setup, a bramka może działać w pierwszym planie lub jako usługa użytkownika. Referencja CLI dokumentuje podpolecenia bramki takie jak run, install, start, stop, status i restart.
Bezpieczeństwo dla bota używającego narzędzi ma znaczenie. Dokumentacja bramki opisuje listy dozwolonych dla konkretnych platform oraz przepływ parowania DM, który wydaje jednorazowe kody parowania i wymaga zatwierdzenia za pomocą hermes pairing approve.
Aktualizacje bez dramy
Aktualizacje Hermes to polecenie pierwszej klasy. Przewodnik aktualizacji dokumentuje hermes update, sprawdzenia migracji konfiguracji oraz małą rutynę weryfikacji po aktualizacji, w tym hermes doctor i hermes gateway status.
hermes update
hermes doctor
hermes gateway status
Rozwiązywanie problemów i diagnostyka
Większość awarii Hermes nie jest tajemnicza. Wyglądają tajemniczo, ponieważ ludzie sprawdzają tylko warstwę modelu i ignorują warstwę środowiska uruchomieniowego.
Szybkie polecenia triażu
Referencja CLI wyraźnie pozycjonuje trzy polecenia jako pętlę główną:
hermes doctordla interaktywnej diagnostykihermes statusdla szybkiego przeglądaniahermes dumpdla udostępnialnego, zredagowanego podsumowania konfiguracji
Dla logów, hermes logs wyświetla pliki przechowywane pod ~/.hermes/logs.
hermes doctor --fix
hermes status
hermes dump --show-keys
hermes logs errors -f
Częste błędy instalacji
FAQ i przewodnik rozwiązywania problemów wymienia kilka nawracających problemów i ich napraw, w tym problemy z wersją Pythona, brak uv oraz problemy z uprawnieniami spowodowane mieszaniem instalacji sudo z instalacjami użytkownika.
Jeśli napotkasz te błędy, dokumentacja zapewnia konkretne kroki naprawcze, takie jak aktualizacja Pythona, instalacja uv i ponowna instalacja Hermes bez sudo.
Problemy z dostawcą i modelem
Gdy klucze API nie działają, FAQ zaleca sprawdzenie konfiguracji, ponowne uruchomienie hermes model lub ustawienie klucza bezpośrednio przez hermes config set. Wskazuje również na częstą pułapkę: klucze są specyficzne dla dostawcy.
Dla problemów „model nie znaleziony", FAQ odsyła do użycia hermes model, aby wybrać ważny identyfikator i pokazuje zarówno nadpisanie konfiguracji, jak i nadpisanie sesji.
Zakończone są również kwestie ograniczania przepustowości i długości kontekstu. FAQ sugeruje czekanie na błędy 429, przełączanie dostawców lub modeli oraz zmniejszanie presji kontekstowej poprzez kompresję lub nową sesję.
Problemy z backendem terminala i bramką
Jeśli polecenia terminala zawalają się natychmiastowo, przewodnik konfiguracji zawiera sekcję „częste problemy z backendem terminala" i wskazuje typowe przyczyny dla każdego backendu, w tym brak działającego Dockera i brakujące zmienne SSH. Zauważa również, że powrót do lokalnego backendu jest ważnym krokiem diagnostycznym, gdy konfiguracja piaskownicy jest w kwestii.
Dla problemów z bramką, przewodnik komunikacyjny podkreśla listy dozwolonych i parowanie jako bezpieczne domyślne ustawienia, co oznacza, że wiele incydentów „bot jest cichy" to tak naprawdę autoryzacja wykonująca swoją pracę.