LLM

Usuń wszystkie modele routera llama.cpp bez restartowania

Usuń wszystkie modele routera llama.cpp bez restartowania

Darmowa pamięć VRAM bez zabijania llama-server.

Tryb routera w llama.cpp to jedna z najbardziej przydatnych zmian wprowadzonych do llama-server w ciągu ostatnich lat. Wreszcie daje lokalnym operatorom modeli LLM coś w rodzaju zarządzania modelami, do którego są przyzwyczajeni z Ollama, jednocześnie zachowując surową wydajność i kontrolę na niskim poziomie, która sprawia, że warto korzystać z llama.cpp w pierwszej kolejności.

Sterowanie głosem Hermes z telefonu

Sterowanie głosem Hermes z telefonu

Pozwól, by Hermes rozmawiał z Tobą przez telefon

Już teraz rozmawiasz z agentem Hermes przez telefon za pomocą wiadomości tekstowych. Teraz chcesz rozmawiać z nim bezpośrednio i otrzymywać odpowiedzi w formie mowy. Zazwyczaj jest to słuszny krok, zwłaszcza jeśli już korzystasz z Hermesa jako trwałego, lokalnie hostowanego asystenta. Pisanie długich promptów na małym ekranie jest powolne i podatne na błędy.

Tworzenie umiejętności agenta Hermes — struktura pliku SKILL.md i najlepsze praktyki

Tworzenie umiejętności agenta Hermes — struktura pliku SKILL.md i najlepsze praktyki

Autor Hermes oferuje umiejętności, które ładują się szybko i działają niezawodnie

Hermes Agent traktuje umiejętności (skills) jako domyślny sposób nauczania powtarzalnych procesów. Oficjalna dokumentacja opisuje je jako dokumenty wiedzy dostępne na żądanie, zgodne z otwartym schematem agentskills.io, ładowanymi poprzez stopniową ekspozycję (progressive disclosure), dzięki czemu model widzi najpierw mały indeks i pobiera pełne instrukcje dopiero wtedy, gdy zadanie ich faktycznie wymaga.

Pamięć systemów AI — trwała wiedza i pamięć agentów

Pamięć systemów AI — trwała wiedza i pamięć agentów

Trwała wiedza wykraczająca poza pojedynczą rozmowę.

Ten rozdział zbiera przewodniki dotyczące trwałej wiedzy i pamięci dla systemów AI — jak asystenci utrzymują fakty, preferencje i skondensowany kontekst między sesjami, bez wciskania każdego tokenu do jednego promptu. Tutaj „pamięć” oznacza świadome utrwalanie (faktów dotyczących użytkownika, streszczeń, baz danych wspieranych przez wtyczki), a nie pamięć GPU czy wag modelu.

Porównanie Agent Memory Providers — Honcho, Mem0, Hindsight oraz pięć innych rozwiązań

Porównanie Agent Memory Providers — Honcho, Mem0, Hindsight oraz pięć innych rozwiązań

Osiem wymiennych backendów dla trwałej pamięci agenta.

Nowoczesni asystenci wciąż zapominają wszystko po zamknięciu karty, chyba że coś zachowuje trwałość poza oknem kontekstowym. Dostawcy pamięci agentów (Agent memory providers) to usługi lub biblioteki, które przechowują fakty i podsumowania pomiędzy sesjami — często integrowane jako wtyczki (plugins), dzięki czemu framework pozostaje lekki, podczas gdy pamięć jest skalowalna.

System Hermes Agent Memory: Jak w rzeczywistości działa trwała pamięć AI

System Hermes Agent Memory: Jak w rzeczywistości działa trwała pamięć AI

Pamięć to różnica między narzędziem a partnerem.

Znasz to. Otwierasz czat z agentem AI, wyjaśniasz swój projekt, dzielisz się preferencjami, wykonujesz jakąś pracę i zamykasz kartę. Wracasz tydzień później i czujesz się, jakbyś rozmawiał z nieznajomym — cały kontekst zniknął, każda preferencja została zapomniana, a projekt trzeba tłumaczyć od nowa.