AI - Page 3 - Rost Glukhov | Strona osobista i blog techniczny

Wtyczki OpenClaw — przewodnik po ekosystemie i praktyczne rekomendacje

Ten artykuł dotyczy wtyczek OpenClaw — natywnych pakietów bramkowych, które dodają kanały, dostawców modeli, narzędzia, funkcje głosowe, pamięć, media, wyszukiwanie w sieci oraz inne warstwy środowiska wykonawczego.

Wzory konfiguracji OpenClaw w środowisku produkcyjnym z użyciem wtyczek i umiejętności

OpenClaw wygląda prosto w demonstracjach. W środowisku produkcyjnym staje się on systemem.

Claude, OpenClaw i koniec płaskiego modelu cenowego dla agentów

Cicha luka, która napędzała falę eksperymentów z agentami, została teraz zamknięta.

Szybki start z Vane (Perplexica 2.0), Ollama i llama.cpp

Vane to jedna z bardziej praktycznych pozycji w przestrzeni „AI z wyszukiwaniem i cytowaniami": samodzielnie hostowana silnia odpowiedziowa, która łąży pobieranie danych z sieci w czasie rzeczywistym z lokalnymi lub chmurowymi modelami LLM, zachowując jednocześnie pełną kontrolę nad całą infrastrukturą.

Instalacja i konfiguracja Claude Code dla Ollama, llama.cpp, ceny

Claude Code to nie autouzupełnianie z lepszym marketingiem. To narzędzie kodowania agentowe: czyta Twoją bazę kodu, edytuje pliki, uruchamia polecenia i integruje się z Twoimi narzędziami developerskimi.

Asystent Hermes AI – instalacja, konfiguracja, przepływ pracy i rozwiązywanie problemów

Hermes Agent to samodzielnie hostowany, niezależny od modelu asystent AI, który działa na lokalnym komputerze lub tanim serwerze VPS, współpracuje przez interfejs terminala i komunikatora oraz rozwija się z czasem, zamieniając powtarzalne zadania w wielokrotnego użytku umiejętności.

TGI – Text Generation Inference – instalacja, konfiguracja, rozwiązywanie problemów

Text Generation Inference (TGI) ma bardzo specyficzną energię. Nie jest najmłodszym dzieckiem na ulicy inferencji, ale jest tym, które już nauczyło się, jak produkcja się psuje –

16 GB VRAM LLM benchmarks with llama.cpp (speed and context)

Porównuję tutaj szybkość działania kilku modeli LLM uruchamianych na GPU z 16 GB pamięci VRAM i wybieram najlepszy z nich do samodzielnego hostowania (self-hosting).

Ollama w Docker Compose z obsługą GPU i trwałą pamięcią modeli

Ollama świetnie działa na “gołym metalu”. Zyskuje jednak na ciekawości, gdy potraktujesz ją jako usługę: stabilny punkt końcowy, zablokowane wersje, trwałe przechowywanie danych oraz dostępność GPU, która jest albo dostępna, albo nie.

Ollama za certyfikatem odwróconym (reverse proxy) z Caddy lub Nginx do strumieniowego dostępu HTTPS

Uruchomienie Ollama za pośrednictwem proxy odwrotnego to najprostszy sposób na uzyskanie HTTPS, opcjonalnej kontroli dostępu oraz przewidywalnego zachowania strumieniowego.

Szybki start z SGLang: instalacja, konfiguracja i uruchamianie modeli LLM przez API OpenAI

SGLang to wysokowydajny framework do obsługi dużych modeli językowych i multimodalnych, zaprojektowany do zapewnienia niskiego opóźnienia i wysokiej przepustowości podczas wnioskowania, niezależnie od tego, czy działa na pojedynczej karcie GPU, czy w rozproszonych klastrach.

Szybki start przełącznika modeli llama.swap dla lokalnych LLM kompatybilnych z OpenAI

Wkrótce będziesz balansować między vLLM, llama.cpp i innymi rozwiązaniami – każdy stos na własnym porcie. Wszystko w dalszym ciągu oczekuje jednego podstawowego adresu URL /v1; inaczej ciągle będziesz przesuwać porty, profile i skrypty ad-hoc. llama-swap jest proxy /v1 przed tymi stosami.

Systemy AI: samodzielnie hostowani asystenci, RAG i infrastruktura lokalna

Większość lokalnych konfiguracji sztucznej inteligencji zaczyna się od modelu i środowiska uruchomieniowego.

Recenzja Oh My Opencode: szczere wyniki, ryzyka rozliczeniowe i kiedy się to opłaca

Oh My Opencode obiecuje „wirtualny zespół deweloperski AI" — Sisyphus koordynuje specjalistów, zadania są wykonywane równolegle, a magiczne słowo kluczowe ultrawork uruchamia całą tę machinę.

Szybki start z OpenCode: instalacja, konfiguracja i uruchomienie

Oh My Opcode przekształca OpenCode w harnes do kodowania wieloagentowego: orchestrator deleguje zadania do specjalistycznych agentów działających równolegle.

Najlepsze modele LLM do OpenCode – od Gemmy 4 po Qwena 3.6, przetestowane lokalnie

Przetestowałem, jak OpenCode współpracuje z kilkoma lokalnie hostowanymi modelami LLM na Ollama i llama.cpp, a dla porównania dodałem kilka darmowych modeli z OpenCode Zen.