Model Routing

모델 라우팅: 모든 작업에 하나의 모델을 쓰지 마세요

모델 라우팅: 모든 작업에 하나의 모델을 쓰지 마세요

적합한 작업에 가장 적합한 모델.

200단어 분량의 이메일을 요약하기 위해 700억 파라미터 모델을 실행하는 것은 낭비입니다. 프로덕션 코드를 검토하기 위해 30억 파라미터 모델을 사용하는 것은 무모합니다. 대부분의 시스템은 이 두 극단 사이 어딘가에 존재하며, 바로 여기서 모델 라우팅(model routing)이 그 역할을 합니다.