Ollama

Comment Ollama gère les requêtes parallèles

Comment Ollama gère les requêtes parallèles

Configurer ollama pour l'exécution de requêtes en parallèle.

Lorsque le serveur Ollama reçoit deux demandes en même temps, son comportement dépend de sa configuration et des ressources système disponibles.

Test de Deepseek-R1 sur Ollama

Test de Deepseek-R1 sur Ollama

Comparaison de deux modèles deepseek-r1 avec deux modèles de base

DeepSeek’s première génération de modèles de raisonnement avec des performances comparables à celles d’OpenAI-o1,
y compris six modèles denses distillés à partir de DeepSeek-R1 basés sur Llama et Qwen.

Farfalle vs Perplexica

Farfalle vs Perplexica

Comparaison de deux moteurs de recherche d'IA auto-hébergés

La bonne nourriture est aussi un plaisir pour les yeux. Mais dans cet article, nous comparerons deux systèmes de recherche basés sur l’IA, Farfalle et Perplexica.

Auto-hébergement de Perplexica avec Ollama

Auto-hébergement de Perplexica avec Ollama

Exécuter localement un service du style Copilot ? Facile !

C’est très excitant !
Au lieu d’appeler Copilot ou Perplexity.ai et de tout raconter au monde,
vous pouvez maintenant héberger un service similaire sur votre propre ordinateur ou laptop !

Frontends des LLM

Frontends des LLM

Pas tant d'options à choisir, mais tout de même...

Quand j’ai commencé à expérimenter avec les LLM, les interfaces utilisateur pour eux étaient en développement actif et maintenant certaines d’entre elles sont vraiment excellentes.