Local Inference

Roteamento de Modelos: Pare de Usar Um Único Modelo para Tudo

Roteamento de Modelos: Pare de Usar Um Único Modelo para Tudo

O modelo certo para a tarefa certa.

Executar um modelo de 70 bilhões de parâmetros para resumir um e-mail de 200 palavras é um desperdício. Executar um modelo de 3 bilhões de parâmetros para revisar código de produção é imprudente. A maioria dos sistemas fica em algum ponto intermediário — e é aí que o roteamento de modelos entra.