Allocation de mémoire et planification du modèle dans la nouvelle version d'Ollama - v0.12.1
Mon propre test de planification du modèle ollama
Ici, je compare la quantité de VRAM allouée par la nouvelle version d’Ollama au modèle par rapport à la version précédente d’Ollama. La nouvelle version est pire.