LLM Performance

Vergleich der Eignung von NVIDIA-GPUs für KI

Inmitten des Chaos der modernen Welt vergleiche ich hier die technischen Spezifikationen verschiedener Grafikkarten für KI-Aufgaben (Deep Learning, Objekterkennung und LLMs). Sie sind alle jedoch unglaublich teuer.

Dieser Leitfaden erklärt, wie Ollama parallele Anfragen verarbeitet (Parallelität, Warteschlangen und Ressourcenlimits), und wie Sie dies über die OLLAMA_NUM_PARALLEL-Umgebungsvariable (und verwandte Einstellungen) optimieren können.

Vor nicht allzu langer Zeit wurde veröffentlicht. Lassen Sie uns aufschließen und testen Sie, wie Mistral Small sich im Vergleich zu anderen LLMs schlägt.

Kürzlich haben wir mehrere neue LLMs gesehen, die veröffentlicht wurden. Aufregende Zeiten. Lassen Sie uns testen und sehen, wie sie sich bei der Erkennung logischer Fehlschlüsse schlagen.

Vergleich der Zusammenfassungsfähigkeiten von LLMs

Testen, wie Modelle mit unterschiedlicher Anzahl an Parametern und Quantisierung sich verhalten.

Vergleich der Vorhersagegeschwindigkeit verschiedener Versionen von LLMs: llama3 (Meta/Facebook), phi3 (Microsoft), gemma (Google), mistral (Open Source) auf CPU und GPU.

LLM Performance

Vergleich der Eignung von NVIDIA-GPUs für KI

Wie Ollama parallele Anfragen verarbeitet

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 und Phi – LLM-Test

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Vergleich der Zusammenfassungsfähigkeiten von LLMs

Großer Sprachmodell-Geschwindigkeitstest