Llama-Server Router-Modus – Dynamisches Modellwechseln ohne Neustart
LLMs bereitstellen und austauschen, ohne Neustarts.
Lange Zeit hatte llama.cpp eine offensichtliche Einschränkung: Man konnte nur ein Modell pro Prozess bereitstellen, und ein Wechsel bedeutete einen Neustart.