Tryb Routera w Llama-Server – dynamiczna zmiana modelu bez konieczności ponownego uruchamiania
Służ i wymieniaj modele LLM bez konieczności restartów.
Długo czas llama.cpp miało oczywistą ograniczenie:
można było obsłużyć tylko jeden model na proces, a zmiana wymagała restartu.