LLM Performance

Vergelijking van de geschiktheid van Nvidia GPU’s voor AI

In de warboel van de moderne wereld vergelijk ik hier de technische specificaties van verschillende kaarten die geschikt zijn voor AI-taken (Diep leren, Objectdetectie en LLM’s). Ze zijn echter allemaal ontzettend duur.

Hoe Ollama parallelle verzoeken afhandelt

Deze handleiding legt uit hoe Ollama параллель verzoeken afhandelt (concurentie, wachtrijen en resourcebeperkingen) en hoe u dit kunt optimaliseren met de OLLAMA_NUM_PARALLEL-omgevingsvariabele (en gerelateerde instellingen).

Niet zo lang geleden is vrijgegeven. Laten we even op de hoogte komen en test hoe Mistral Small presteert vergeleken met andere LLMs.

Onlangs hebben we meerdere nieuwe LLMs gezien die zijn vrijgegeven. Opwindende tijden. Laten we testen en zien hoe ze presteren bij het detecteren van logische fouten.

Vergelijking van de samenvattingsvaardigheden van LLM

Testen hoe modellen met een verschillend aantal parameters en kwantificatie zich gedragen.

Vergelijking van de voorspellingsnelheid van verschillende versies van LLMs: llama3 (Meta/Facebook), phi3 (Microsoft), gemma (Google), mistral (open source) op CPU en GPU.

LLM Performance

Vergelijking van de geschiktheid van Nvidia GPU’s voor AI

Hoe Ollama parallelle verzoeken afhandelt

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 en Phi - LLM Test

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Vergelijking van de samenvattingsvaardigheden van LLM

Snelheidstest voor grote taalmodellen