LLM

Usuń wszystkie modele routera llama.cpp bez restartowania

Usuń wszystkie modele routera llama.cpp bez restartowania

Darmowa pamięć VRAM bez zabijania llama-server.

Tryb routera w llama.cpp to jedna z najbardziej przydatnych zmian wprowadzonych do llama-server w ciągu ostatnich lat. Wreszcie daje lokalnym operatorom modeli LLM coś w rodzaju zarządzania modelami, do którego są przyzwyczajeni z Ollama, jednocześnie zachowując surową wydajność i kontrolę na niskim poziomie, która sprawia, że warto korzystać z llama.cpp w pierwszej kolejności.

Sterowanie głosem Hermes z telefonu

Sterowanie głosem Hermes z telefonu

Pozwól, by Hermes rozmawiał z Tobą przez telefon

Już teraz rozmawiasz z agentem Hermes przez telefon za pomocą wiadomości tekstowych. Teraz chcesz rozmawiać z nim bezpośrednio i otrzymywać odpowiedzi w formie mowy. Zazwyczaj jest to słuszny krok, zwłaszcza jeśli już korzystasz z Hermesa jako trwałego, lokalnie hostowanego asystenta. Pisanie długich promptów na małym ekranie jest powolne i podatne na błędy.

Tworzenie umiejętności agenta Hermes — struktura pliku SKILL.md i najlepsze praktyki

Tworzenie umiejętności agenta Hermes — struktura pliku SKILL.md i najlepsze praktyki

Autor Hermes oferuje umiejętności, które ładują się szybko i działają niezawodnie

Hermes Agent traktuje umiejętności (skills) jako domyślny sposób nauczania powtarzalnych procesów. Oficjalna dokumentacja opisuje je jako dokumenty wiedzy dostępne na żądanie, zgodne z otwartym schematem agentskills.io, ładowanymi poprzez stopniową ekspozycję (progressive disclosure), dzięki czemu model widzi najpierw mały indeks i pobiera pełne instrukcje dopiero wtedy, gdy zadanie ich faktycznie wymaga.

Pamięć systemów AI — trwała wiedza i pamięć agentów

Pamięć systemów AI — trwała wiedza i pamięć agentów

Trwała wiedza wykraczająca poza pojedynczą rozmowę.

Ten rozdział zbiera przewodniki dotyczące trwałej wiedzy i pamięci dla systemów AI — jak asystenci utrzymują fakty, preferencje i skondensowany kontekst między sesjami, bez wciskania każdego tokenu do jednego promptu. Tutaj „pamięć” oznacza świadome utrwalanie (faktów dotyczących użytkownika, streszczeń, baz danych wspieranych przez wtyczki), a nie pamięć GPU czy wag modelu.

Porównanie dostawców pamięci agentów — Honcho, Mem0, Hindsight i pięć innych

Porównanie dostawców pamięci agentów — Honcho, Mem0, Hindsight i pięć innych

Osiem wymiennych backendów do trwałej pamięci agenta.

Współczesne asystenty nadal zapominają wszystko po zamknięciu karty, chyba że dane są utrwalone poza oknem kontekstu. Dostawcy pamięci agentów to usługi lub biblioteki przechowujące fakty i streszczenia między sesjami – często integrowane jako wtyczki, dzięki czemu framework pozostaje lekki, a pamięć skalowalna.

System Hermes Agent Memory: Jak w rzeczywistości działa trwała pamięć AI

System Hermes Agent Memory: Jak w rzeczywistości działa trwała pamięć AI

Pamięć to różnica między narzędziem a partnerem.

Znasz to. Otwierasz czat z agentem AI, wyjaśniasz swój projekt, dzielisz się preferencjami, wykonujesz jakąś pracę i zamykasz kartę. Wracasz tydzień później i czujesz się, jakbyś rozmawiał z nieznajomym — cały kontekst zniknął, każda preferencja została zapomniana, a projekt trzeba tłumaczyć od nowa.