대규모 언어 모델 속도 테스트 GPU 대 CPU에서 LLM의 속도를 테스트해 보겠습니다. 다양한 버전의 LLM(llama3, phi3, gemma, mistral)의 예측 속도를 CPU와 GPU에서 비교합니다.