Performance

Strategie cache w Hugo dla wydajności

Strategie cache w Hugo dla wydajności

Optymalizacja tworzenia i uruchamiania witryn Hugo

Caching strategie w Hugo są kluczowe dla maksymalizacji wydajności generatora statycznych stron. Choć Hugo generuje statyczne pliki, które są w naturze szybkie, implementacja odpowiedniego cacheowania na wielu warstwach może znacząco poprawić czas budowania, zmniejszyć obciążenie serwera i poprawić doświadczenie użytkownika.

Jak Ollama obsługuje równoległe żądania

Jak Ollama obsługuje równoległe żądania

Zrozumienie współbieżności, kolejek w Ollama oraz optymalizacja parametru OLLAMA_NUM_PARALLEL dla stabilnych równoległych żądań.

Ten przewodnik wyjaśnia jak Ollama obsługuje równoległe żądania (konkurencja, kolejki i limity zasobów) oraz jak je dostosować przy użyciu zmiennej środowiskowej OLLAMA_NUM_PARALLEL (i powiązanych ustawień).

Test prędkości modeli dużych języków

Test prędkości modeli dużych języków

Sprawdźmy prędkość LLM na GPU vs CPU

Porównanie prędkości przewidywania kilku wersji LLM: llama3 (Meta/Facebook), phi3 (Microsoft), gemma (Google), mistral (open source) na CPU i GPU.