Ollama

Dans ce test, je suis en train de comparer comment différents LLMs hébergés sur Ollama traduisent une page Hugo en anglais vers l’allemand.

Reclassement de textes avec Ollama et l'LLM d'embedding Qwen3 - en Go

Cet exemple de code Go pour le reranking appelle Ollama pour générer des embeddings pour la requête et pour chaque document candidat, puis les trie de manière décroissante selon la similarité cosinus.

Modèles d'embedding et de reranking Qwen3 sur Ollama : des performances de pointe

Les modèles Qwen3 Embedding et Reranker sont les dernières publications de la famille Qwen, conçues spécifiquement pour les tâches avancées d’incorporation de texte (embedding), de récupération et de reranking.

Performance des LLM et voies PCIe : Points clés à considérer

Comment les canaux PCIe affectent les performances des LLM ? Selon la tâche. Pour l’entraînement et l’inférence multi-GPU, la baisse de performance est significative.

Convertir du contenu HTML en Markdown à l'aide d'un LLM et d'Ollama

Dans la bibliothèque de modèles Ollama, il existe des modèles capables de convertir du contenu HTML en Markdown, ce qui est utile pour les tâches de conversion de contenu. Ce guide fait partie de notre Outils de Documentation en 2026 : Markdown, LaTeX, PDF et Flux de Travail d’Impression hub.

Liste ici certains outils de codage assistés par IA et Assistants de codage IA et leurs points forts.

Test : Comment Ollama utilise les performances du processeur Intel et les cœurs efficaces

J’ai une théorie à tester - si l’utilisation de tous les cœurs d’un processeur Intel augmenterait la vitesse des LLM ? Cela me tracasse que le nouveau modèle gemma3 27 bit (gemma3:27b, 17 Go sur ollama) ne tienne pas dans les 16 Go de VRAM de mon GPU, et qu’il s’exécute partiellement sur le CPU.

Ce guide explique comment Ollama gère les requêtes parallèles (concurrence, mise en file d’attente et limites de ressources), et comment l’optimiser à l’aide de la variable d’environnement OLLAMA_NUM_PARALLEL (et des paramètres associés).

DeepSeek’s première génération de modèles de raisonnement avec des performances comparables à celles d’OpenAI-o1, incluant six modèles denses distillés à partir de DeepSeek-R1 basés sur Llama et Qwen.

Cette fiche de référence de la CLI Ollama se concentre sur les commandes utilisées quotidiennement (ollama ls, ollama serve, ollama run, ollama ps, gestion des modèles et flux de travail courants), avec des exemples prêts à copier-coller.

Il y a peu de temps, a été publié. Commençons par un point sur la mise à jour et testons comment Mistral Small se compare aux autres LLMs ici.

Reranking est une deuxième étape dans les systèmes de Génération Augmentée par Récupération (RAG) systèmes, située juste entre la récupération et la génération.

Une excellente cuisine est aussi un plaisir pour les yeux. Mais dans cet article, nous allons comparer deux systèmes de recherche basés sur l’IA, Farfalle et Perplexica.

C’est très excitant ! Au lieu d’appeler Copilot ou Perplexity.ai et de révéler à tout le monde ce que vous recherchez, vous pouvez désormais héberger un service similaire sur votre propre PC ou ordinateur portable !

Récemment, nous avons vu plusieurs nouveaux LLM sortir. Des temps excitants. Testons-les et voyons comment ils se débrouillent lorsqu’ils détectent les fautes logiques.

Il existe toutefois quelques approches courantes pour rédiger des prompts efficaces afin que le modèle de langage ne se confonde pas en tentant de comprendre ce que vous souhaitez.

Ollama

Comparaison de la qualité de la traduction des pages Hugo - LLMs sur Ollama

Reclassement de textes avec Ollama et l'LLM d'embedding Qwen3 - en Go

Modèles d'embedding et de reranking Qwen3 sur Ollama : des performances de pointe

Performance des LLM et voies PCIe : Points clés à considérer

Convertir du contenu HTML en Markdown à l'aide d'un LLM et d'Ollama

Comparaison des assistants de codage IA

Test : Comment Ollama utilise les performances du processeur Intel et les cœurs efficaces

Comment Ollama gère les requêtes parallèles

Test de Deepseek-R1 sur Ollama

Fiche de référence de la CLI Ollama : ls, serve, run, ps et autres commandes (mise à jour 2026)

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 et Phi - Test des modèles de langage

Reclassement avec des modèles d'incorporation

Farfalle contre Perplexica

Auto-hébergement de Perplexica — avec Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Rédiger des prompts efficaces pour les LLMs