Local Inference

Instradamento dei modelli: smetti di usare un unico modello per tutto

Instradamento dei modelli: smetti di usare un unico modello per tutto

Il modello giusto per il compito giusto.

Eseguire un modello con 70 miliardi di parametri per riassumere un’email di 200 parole è uno spreco. Utilizzare un modello da 3 miliardi di parametri per revisionare il codice di produzione è imprudente. La maggior parte dei sistemi si trova da qualche punto intermedio ed è qui che entra in gioco il routing dei modelli.