Comparaison des performances des LLMs sur Ollama avec un GPU de 16 Go de VRAM
Test de vitesse des LLM sur RTX 4080 avec 16 Go de VRAM
L’exécution locale de grands modèles de langage (LLM) vous offre confidentialité, fonctionnement hors ligne et zéro coût d’API. Ce benchmark révèle exactement ce qu’on peut attendre de 14 LLMs populaires sur Ollama avec une RTX 4080.