LLM Performance

Jämförelse av lämpligheten för NVidia GPU:er för AI

Mitt i modern världens turbulens jämför jag här tekniska specifikationer för olika grafikkort som passar för AI-uppgifter (Djupinlärning, Objektdetektion och LLM). De är dock alla otroligt dyra.

Den här guiden förklarar hur Ollama hanterar parallella begäran (konkurrens, köhantering och resursbegränsningar) och hur du kan justera det med hjälp av miljövariabeln OLLAMA_NUM_PARALLEL (och relaterade inställningar).

Inte för länge sedan släpptes. Låt oss uppdatera och
testa hur Mistral Small presterar jämfört med andra LLMs.

Nyligen har vi sett flera nya LLM:er släppas. Spännande tider. Låt oss testa och se hur de presterar när de upptäcker logiska fall.

Jämförelse av LLM:s sammanfattningsförmåga

Testa hur modeller med olika antal parametrar och kvantisering beter sig.

Jämförelse av förutsägelsehastighet hos flera versioner av LLMs: llama3 (Meta/Facebook), phi3 (Microsoft), gemma (Google), mistral (open source) på CPU och GPU.

LLM Performance

Jämförelse av lämpligheten för NVidia GPU:er för AI

Hur Ollama hanterar parallella begäran

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 och Phi - LLM-test

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Jämförelse av LLM:s sammanfattningsförmåga

Hastighetstest för stora språkmodeller