Self-Hosting

Reranking dokumentów przy użyciu Ollama i modelu Qwen3 Reranker – w języku Go

Ponieważ standardowe Ollama nie posiada bezpośredniego interfejsu API do ponownego rankingu (reranking), musisz zaimplementować ponowny ranking przy użyciu Qwen3 Reranker w GO, generując wektory (embeddings) dla par zapytanie-dokument i przypisując im oceny.

Porównanie jakości tłumaczenia stron w Hugo – LLMs na Ollama

W tym teście porównuję, jak różne LLMs hostowane na Ollama tłumaczą stronę Hugo z języka angielskiego na niemiecki.

Ponowne rankowanie tekstów przy użyciu Ollama i Qwen3 Embedding LLM – w Go

Ten niewielki przykład kodu Go do rerankingu wywołuje Ollamę do generowania wektorów dla zapytania oraz dla każdego dokumentu kandydackiego, następnie sortuje wyniki malejąco według podobieństwa kosinusowego.

Ceny kart Nvidia RTX 5080 i RTX 5090 w Australii – czerwiec 2025

Tylko trzy miesiące temu nie mogliśmy kupić RTX 5090 w sklepach, a teraz są już dostępne, choć ceny są nieco wyższe niż MSRP. Porównajmy najniższe ceny RTX 5080 i RTX 5090 w Australii i zobaczmy, jak wygląda sytuacja.

Dla porównania zobacz też Ceny RTX 5080 i RTX 5090 w Australii – lipiec 2025, październik 2025 oraz listopad 2025.

YaCy: Rozproszony silnik wyszukiwania, zalety, wyzwania i przyszłość

YaCy to decentralizowany, peer-to-peer (P2P) silnik wyszukiwania zaprojektowany do działania bez centralnych serwerów, umożliwiający użytkownikom tworzenie lokalnych lub globalnych indeksów oraz wykonywanie wyszukiwań poprzez zapytania do rozproszonych par.

Czy Quadro RTX 5880 Ada 48GB jest dobry?

Najlepszy zautomatyzowany system do niesamowitej pracy.

Modele Qwen3 Embedding i Reranker na Ollama: osiągnięcia stanowiące stan techniki

Modele Qwen3 Embedding i Reranker (https://www.glukhov.org/pl/rag/embeddings/ “Modele Qwen3 Embedding i Reranker na platformie ollama”) to najnowsze wydania z rodziny Qwen, zaprojektowane specjalnie do zaawansowanych zadań związanych z tworzeniem wektorów tekstu (embedding), odnajdywaniem informacji (retrieval) oraz ponownym ocenianiem wyników (reranking).

Jak przechowywać miniatury obrazów w folderze page bundle dla stron Hugo z motywem Mainroad

Już od dłuższego czasu męczy mnie ten uciążliwy problem, polegający na umieszczaniu miniatur z obrazów stron w katalogu statycznym. To dotyczy Mainroad, Rodster i podobnych tematów Hugo.

Wydajność modeli językowych i kanały PCIe: kluczowe zagadnienia

Jak liczba linii PCIe wpływa na wydajność LLM? W zależności od zadania. Dla treningu i inferencji wielo-GPU spadek wydajności jest znaczący.

Wdrażanie witryny Hugo na AWS S3 przy użyciu Gitea Actions

Następnym krokiem jest zaimplementowanie niektórych CI/CD i ustawienie Gitea Actions for Hugo website, to push website to AWS S3 automatycznie, gdy zostanie zaktualizowana gałąź master.

Konwertuj zawartość HTML na Markdown za pomocą LLM i Ollama

W bibliotece modeli Ollama są modele, które potrafią konwertować zawartość HTML na Markdown, co jest przydatne w zadaniach związanych z konwersją treści. Ten przewodnik jest częścią naszego Narzędzia dokumentacyjne w 2026: Markdown, LaTeX, PDF i przepływ pracy druku hub.

Poniżej wymienię narzędzia wspomagające kodowanie z pomocą AI oraz Asystentów AI do Kodowania i ich zalety.

Test: Jak Ollama wykorzystuje wydajność i efektywne jądra procesora Intel

Mam teorię do przetestowania – czy wykorzystanie Wszystkich rdzeni na procesorze Intel podniesie prędkość LLM? Zdenerwuje mnie fakt, że nowy model gemma3 27 bit (gemma3:27b, 17GB na ollama) nie mieści się w 16GB VRAM mojej karty graficznej, a częściowo działa na procesorze.

MinIO Parametry wiersza poleceń – cheat sheet

MinIO oferuje dwa standardowe interfejsy użytkownika: (1) MinIO Console – to interfejs webowy, oraz (2) MinIO Command – to wiersz poleceń util mc.

Minio jako alternatywa dla AWS S3. Przegląd i instalacja Minio.

MinIO to system do przechowywania obiektów (object storage) o otwartym kodzie źródłowym i wysokiej wydajności, zaprojektowany tak, aby był w pełni kompatybilny z interfejsem API Amazon S3.

Porównanie przydatności kart graficznych NVidia w zastosowaniach AI

Wśród współczesnych burz porównuję specyfikacje techniczne różnych kart odpowiednich do zadań w zakresie AI (Deep Learning, Object Detection oraz LLMs). Są one jednak niezwykle drogie.