LLM Performance

Come Ollama gestisce le richieste parallele

Come Ollama gestisce le richieste parallele

Comprendi la concorrenza, la gestione delle code in Ollama e come ottimizzare OLLAMA_NUM_PARALLEL per richieste parallele stabili.

Questa guida spiega come Ollama gestisce le richieste parallele (concorrenza, code e limiti delle risorse) e come ottimizzarla utilizzando la variabile d’ambiente OLLAMA_NUM_PARALLEL (e i relativi parametri).

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Test della rilevazione delle fallacie logiche

Recentemente abbiamo visto l’uscita di diversi nuovi LLM. Tempi eccitanti. Proviamo a testarli e a vedere come si comportano nel rilevare le fallacie logiche.