Local Inference

Routage des modèles : cessez d'utiliser un seul modèle pour tout

Routage des modèles : cessez d'utiliser un seul modèle pour tout

Le bon modèle pour la bonne tâche.

Exécuter un modèle de 70 milliards de paramètres pour résumer un e-mail de 200 mots est un gaspillage. Utiliser un modèle de 3 milliards de paramètres pour passer en revue du code en production est imprudent. La plupart des systèmes se situent quelque part entre les deux — et c’est là qu’intervient le routage de modèles.